:: 게시판
:: 이전 게시판
|
- 자유 주제로 사용할 수 있는 게시판입니다.
- 토론 게시판의 용도를 겸합니다.
통합규정 1.3 이용안내 인용"Pgr은 '명문화된 삭제규정'이 반드시 필요하지 않은 분을 환영합니다.법 없이도 사는 사람, 남에게 상처를 주지 않으면서 같이 이야기 나눌 수 있는 분이면 좋겠습니다."
20/03/08 19:37
지인에게서 들은 얘기지만 온갖 분야에 딥러닝을 적용해보다가
현장에서는 '이거 사기 아니냐'는 얘기가 스멀스멀 나오고 있다고 하더라구요. 저런 얘기가 나오는 이유는 결국 글에 적혀있는 대로 [어떻게 잘 되는 건지를 모르기 때문]인 건데... 이를 극복하기 위한 컨셉에 대한 얘기도 들어보긴 했는데 (eXplainable Artificial Intelligence, XAI) 의미있는 연구가 되었는지는 모르겠네요. 저도 이쪽 분야에 있지만 아직도 갈길이 먼 거 같습니다. 할 일이 많다는 건 사실 좋은 일이지만요.
20/03/08 21:44
사실 거의 대부분의 머신러닝은 블랙박스죠. 뉴럴넷 다음으로 사용되는 SVM도 블랙박스, 앙상블 기법도 블랙박스니까요. 수많은 비모수적 모형들이 있고, 이중 거의 대부분은 블랙박스입니다. 하지만 블랙박스라는 것 자체가 문제가 되기엔 너무 많이 왔죠.
물론 말씀하신 연구가 진행되고 있고, LIME과 같이 어느정도 체계를 갖춘 알고리즘이 나오고도 있습니다. 이는 머신러닝의 미래에 매우 큰 역할을 할거라 생각이 됩니다. 사실 저도 졸업논문에 끼워넣으려다 실패한 내용입니다 ㅠㅠ
20/03/08 19:57
프로그래밍 커뮤니티에 갔다가, 어떤 고등학생이 로또 전 회차 데이터로 아무리 학습을 시켜도 적중율이 안 나온다고 자기가 뭘 잘못한건지 가르쳐달라는 질문을 봤던 기억이 나네요 크크크...
애초에 딥러닝으로 풀 수 없는 문제는 원래 안됩니다;;
20/03/08 21:50
머신러닝은 많은 경우에 기존이 모형들이 하던걸 잘 하는 모형의 의미가 있지 기존 모형이 못하던걸 하게 만들려면 훨씬 어렵고 지난한 과정이 필요합니다.
예를들어 딥러닝으로 주식 등락을 맞추려는 노력이 있는데, 잘 안 됩니다. 왜냐면 주식 시세에 영향을 끼치는 변수를 파악하고 수집하는것 자체가 미친 짓이라서... 이게 되면 구글에서 벌써 펀드매니징을 하고 있겠죠. 아니 그전에 저도 박사 안받고 차트질을 하고 있을텐데 현실은 그렇지가 못합니다.
20/03/08 22:06
친구놈들이 하던게 바로 그 주식입니다 크크크
Ai 강사 한 분은 주식가격만 수집해서 오르냐 내리냐만 판별하니 어느정도 자기기준에서 만족할만한 수익률이 나오더라 하긴 하셨는데, 제가 볼때도 영...
20/03/08 22:12
제가 딱 그거같아서 안된다고 콕 찝어서 말씀드린겁니다 크크크크
솔직히 딥러닝으로 트럼프가 화웨이한테 세컨더리 보이콧 걸고 그런거를 어떻게 맞춰요...진짜 강인공지능이 나와도 인간놈들의 광기엔 두손 들고 나올거라 봅니다.
20/03/08 20:45
제조업 분야에서 현재 머신 딥러닝 적용해 보려고 이것저것 하는데 제일 문제는 이 데이터 셋으로 이게 성공할지 완전 망할지 판단하기가 어렵다는 거네요. 물론 데이터셋이 적기 때문이겠지만..
20/03/08 21:57
보통 데이터 샘플이 적으면 머신러닝이 잘 작동하지 않습니다. 충분한 데이터가 확보되지 않은 경우에는 이론 기반의 모형이 보통은 더 잘 맞습니다. 가지고 계신 데이터셋 내에서 학습셋, 검증셋, 테스트셋을 나누어서 검증 결과를 거쳐 보고, 이게 잘 나오면 사용하고 아니면 다른 방식을 찾아보는게 일반적으로 추천되는 방식입니다.
꼭 딥 러닝 뿐만 아니라 앙상블 모형의 경우에도 많은 양의 데이터가 확보되지 않으면 정확도를 기대하기 어렵습니다. 특히 복잡한 모형일수록 더욱 그렇죠.
20/03/08 21:04
개인적인 감상으로 딥러닝은 개발자의 '딥러닝에 대한 기능적 이해도' + '적용하고자 하는 분야에 대한 이해도' (보통 수치화, 표본화되기 좋을수록 가능성 ↑)
가 있어야 성공할 확률이 높아지는 것 같습니다. 그러다보니 '내 분야는 잘 알지만 딥러닝은 뭔지 모름' or '딥러닝은 아는데 어따 적용할지 잘 모름' 인 경우도 자주 보이고요. (그런만큼 여전히 적용해볼 분야가 다양하고 유망하지 싶지만요.) 예로 뉴스로도 종종 나오는 얘기인 AI 판사... 제 생각에는 당분간은 실현가능성이 없지 싶은데, 법조인들도 딥러닝을 모르고 개발자들도 법학을 모르기 때문인지 다소 뜬구름(?)잡는 얘기가 많더라고요.
20/03/08 22:00
저는 "딥 러닝에 대한 기능적 이해도"보다는 "적용하고자 하는 분야에 대한 이해도"가 천배 정도 중요하다고 생각합니다.
사실 딥 러닝을 하는데 막강한 실력의 코딩이 필요하진 않습니다. 저도 굉장히 일천한 파이썬 실력으로 논문 썼어요. 아직은 컴퓨터 공학의 영역에 머무르고 있지만, 앞으로는 얘기가 달라질 것으로 생각합니다.
20/03/08 22:10
아, '(전문적)개발자의 이해도' 이 아니라 '딥러닝을 시도해보려는 사람(광의의 개발자)의 이해도' 를 생각하고 썼는데 좀 표현이 잘못됐네요. 전공으로 몇번 배우고 개발해본 입장에서 가끔 '이거 딥러닝으로 해볼만하지?' 라는 비전공 친구들을 볼 때 '오.. 뜬구름 잡는데?' 라고 느낀 적이 있어서요.
20/03/08 22:14
맞는 말씀입니다. 이게 그냥 다 잘된다 잘된다 하니 뜬구름 잡는 얘기도 참 많이 나오죠.
특히 비지도학습 얘기를 어디서 듣고 와서 다 되는거 아니냐고 하면 좀 그렇습니다 ㅠㅠ
20/03/08 21:33
사악한 드래곤 로드로부터 인류를 수호하시고 바이서스를 굽어보시며 영원한 기사들의 주군 이자 대 마법사 핸드레이크의 친우 신앙의 수호자이신 루트에리노 대왕님께서 마침내 기계정벌을 선포하셨습니다
20/03/08 23:12
이론적인 이해가 훨씬 뒤쳐져 있는 것은 사실이지만, 발전이 없는것은 아니라서 희망적이라고 봅니다. 그래도 제가 생각하는 이론분야 연구의 문제는 machine learning 커뮤니티의 사이클이 너무 빠르다는 겁니다. 나온지 1,2년된 기술도 사실 이론적으로는 제대로 이해 못하는데 SOTA는 거기다가 뭐 더하고 뭐 더해서 새로운 결과를 내버리니, 이론하는 사람들이 끈적하게 문제 하나 붙들고 생각할만한 시간이 별로 없는것 같아요. 사실 이론연구에서 breakthrough는 많은 사람들이 각자 한마디씩 하는게 아니라 뭔가 통합하는 view를 제시 할 수 있어야 하는데, 다들 자기 할일이 바빠서 이런 논문은 매우 드문 것 같아서 오히려 사람이 많은게 역효과가 아닌가 싶습니다.
20/03/09 11:28
저는 오히려 반대로 생각하는데, 아직도 더 나은 기술이 나오기 때문에 SOTA가 지속적으로 바뀌고 있다고 생각합니다.
이게 더 나은 기술이 나오지 않으면 이제 좀더 깊게 파게 되겠죠. 사실 저도 SOTA가 너무 급변해서 미칠 거 같습니다 ㅠㅠ
20/03/09 16:58
제가 말하는건 순수 이론적인 부분이었습니다. 아직 PAC이론을 넘어서 왜 overparaetrized CNN에서 generalization이 잘되는지 아무도 제대로 된 답을 못해요. 그런데 SOTA는 Residual connection, BatchNorm 등등으로 무장해있죠. 현재 이론논문은 각각에 대해서 대강 이런것 같다를 말하는 거지 거시적인 view에 대해서는 별로 알려주는게 없습니다.
20/03/09 02:51
결국 지능과 의식이 무엇인지 답을 내지 못하면 다시 겨울이 올수도 있죠.
스케일만 키워서 가능하다는 캠프 vs 딥러닝가지곤 안된다 두가지가 있는데 미지의 영역이죠. 뇌과학쪽에서 치고올라와줘야하는데...
20/03/09 11:35
저는 딥 러닝만으로는 안된다고 보는 쪽입니다. 해보면 더 명확하게 다가오는데, 딥 러닝은 지능이 가진 수많은 기능 중에 아주 일부분만을 제한된 상황에서 실현할 수 있을 뿐이죠. 물론 이것만으로도 예전에 못했던 것들이 가능합니다.
결국 인류가 원하는건 범용 AI인데, 이게 어떤 방식으로 도달될 지는 전혀 오리무중입니다.
20/03/09 08:21
인간의 지능이나 인공지능이나 블랙박스인건 마찬가지죠.
양자역학의 세계도 비슷하죠. 수학도 맞고 측정도 맞는데 이해는 안돼.. 이게 머여 ? 인간보다 몇차원 높은 AI엔진이 작동시키고 있는 사기같은 느낌적인 느낌
20/03/09 11:40
저는 오히려 딥 러닝 공부하면서 인간의 지능, 나아가 생명체의 지능이라는게 얼마나 사기적이고 위대한지를 알 수 있었습니다.
이거 공부하면서 아직 인류가 알아야 하는게 얼마나 많은지 깨달았어요. 그게 저같은 연구자들한텐 참 다행한 일입니다.
20/03/09 11:30
좋은 글 감사합니다. 연재 기다리고 있었는데 늦어진 사연이 있었나보네요.
업무에 적용을 해보고 싶긴 한데 텐서플로우나 케라스 기본 예제만 돌려보는 수준에서 막혀있네요 흐흐
20/03/09 11:44
네 크크크 졸업논문과 아즈카반의 콜라보로 인해 많이 늦어졌습니다.
혹시 업무용으로 가지고 계시는 데이터가 있으시면 그걸 먼저 적용해보시는게 가장 빠른 길입니다. 텐서플로우가 아예 코어 레벨에서부터 케라스로 가겠다는 발표를 해버려서 케라스를 위주로 배우시는게 좋을 듯 합니다.
20/03/09 16:01
잘 읽었습니다. 지금 학계와 현업에서는 [왜 잘되는지 모르겠는데 상태]가 생각보다 크리티컬 한 것 같습니다. 생각보다 사람의 일에는 이유를 알아야 되는 경우가 많거든요. 예를 들어 자율 주행의 시나리오에서 사고가 났을때 왜 사고가 났는지 분석을 해야 책임 소지를 가릴 수 있는데 이런부분에서 애를 먹는거 같아요. 그래서 실제로 이런 부분을 극복하기 위한 알고리즘을 만드려고 노력하는게 보입니다. 딥러닝의 노드와 레이어를 해석 가능한 노테이션을 쓴다던가...
현업에서도 재밌는 일들이 많아요. 모델을 배치하고 나면 이런저런 이슈가 발생하는데 왜 발생했어? 왜 잘해? 왜 못해? 라는 질문들이 상부에서 쏟아집니다. 그럴때 마다 알고리즘이 그랬어요 라고 하지만 그래서 알고리즘 만든게 누군데? 만들었는데 왜 몰라? 라고 하면 할말 없거든요. 그럴땐 데이터싸이언스의 필살기 데이터가 그랬어요 라고 하고 빠져나오긴 합니다만.... 사실 정확히 어떤 데이터 때문인데라고 하면 찾기 어려운게 사실이에요. (그렇다고 불가능한건 아니지만 거기에 시간과 노력을 쏟기에는...) 그러다 보니 울며 겨자먹기로 아주 구닥다리 알고리즘이 통할때가 있어요. 아주 보수적인 NLP 도메인이 대표적인데 예를들어 가전제품 같은 경우에 못알아 먹는건 용서해도 잘못알아먹는건 용서가 안될때가 있단말이죠. 세탁기에서 건조하라고 했는데 행굼 돌려버리면 난리나듯이요. 그래서 이런 경우 모회사라고 말하긴 그렇지만 아직도 정규표현식 매칭 수준의 알고리즘을 써요. 분명하거든요. 이런 데이터가 있어서 이걸 행굼으로 인식했네가 되니까요. 이쪽 업계에 있을수록 느끼는게 버릴 알고리즘은 없다는 느낌이에요. 다 써먹기 나름이랄까... 사실 뉴럴네트워크도 한때 가장 천덕꾸러기 신세였잖아요. 결국 돌고 돌지만 결국 이쪽 기술이 지금은 다시 한계에 온 느낌은 있어요. 잘하긴 하는데 데이터가 받쳐줘야하고 어디까지나 사람의 레벨에서 소수의 미션을 일부 사람보다 더 잘하는 수준이거든요. 그러다 보니 또 기대에 비해 실망하는 케이스들이 늘고 있어서... 특히 우리나라는 이쪽을 잘 컨트롤 하는 인력도 없고... 무엇보다 데이터 구축 시스템이 잘 안되 있는데 너도 나도 알파고급 기대를 하는 경우도 많아요. 난 거짓말을 한적이 없는데 가끔 사기꾼이었자나 눈초리를 받을때는 뭔가 억울하기도 합니다 크...
|