● 인공지능을 만드는 방법으로써 머신러닝은 딥러닝이 주춤하는 사이 2,000년대 초반을 주름잡았다 말씀드렸습니다. 사실 머신러닝은 유력한 지배 방정식이 존재하고, 데이터가 상대적으로 많지 않은 분야에서는 지금도 유효하고, 강력합니다. 앙상블 기법을 쓰면 성능이 어지간한 딥러닝 모델보다도 좋게 나옵니다(..). 머신러닝과 딥러닝의 차이점을 명확히 알기 위해서는 공통점부터 살피는 것이 좋습니다.
● 이 둘의 공통점은 데이터를 학습하여 모델을 만든다는 점, 이 모델을 통해 분류 혹은 예측 등을 수행할 수 있다는 점입니다. 딥러닝에는 들어가지 않지만 머신러닝에는 포함되어 있는 것들에는 선형 회귀, 결정트리, SVM, KNN, 랜덤포레스트, 베이즈 네트워크, 주성분분석(PCA) 등이 있습니다. 음. 지난번 머신러닝을 살펴볼 때, 다루었던 단어들이 눈에 띄는군요. 베이즈 네트워크, 주성분 분석(PCA), 선형 회귀 등을 제외하면 말이죠.
● 그렇다면 인공지능, 머신러닝, 딥러닝 중 사람들에게 가장 많이 언급되는 단어는 무엇일까요? 많이들 혼용해서 쓰고 있는 실정이지만, 그 중에서도 머신러닝이라는 단어를 가장 많이 씁니다. 왜 그럴까요? 인공지능하면 너무 오래된 냄새가 납니다. 또, 인공지능하면 양치기 소년 혹은 마케팅 용어 같은 의심의 눈초리를 받을 수 있습니다. 그렇다고 딥러닝이라고 하면 음(..) 뭔가 범위가 확 좁아지는 느낌도 납니다. 결국, 인공지능과 딥러닝의 타협점으로 중간자적 위치에 있는 머신러닝이라는 용어를 사용하게 많이들 사용합니다. 이런 느낌일겁니다. 나 딥러닝 하는데 말이야.. 그렇다고 딥러닝만 할 줄 안다고 하면 안 될 것 같아. 피처 엔지니어링도 할 줄 알고, 나름 데이터에서 결과가 잘 나오게 하는 피처가 뭔지 뽑아낼 줄 아는 능력도 있다는 걸 어필하고 싶어(..) 그렇다면...!! 머신러닝 한다고 하자!
● 아하, 그런의미에서 요새 사람들이 말하는 머신러닝은 전통적인 머신러닝이라기보다는 딥러닝에 가깝다고 볼 수도 있을 것 같습니다. 용어 구분해서 안 쓴다고 짜증이 좀 났었는데, 이 세 가지를 구분하지 않고 혼용해서 쓰는 것에도 나름 현실적인 이유가 있었던 것이었군요. 예전보다는 짜증이 덜 날 것 같습니다.
● 머신러닝에는 들어가지 않으나, 인공지능에는 들어가는 분야에는 전문가 시스템, 퍼지논리, 유전 알고리즘 등이 있습니다. 전문가 시스템은 전문가의 지식을 체계적으로 잘 조직하여 컴퓨터 시스템에 입력시켜 해당 분야의 비전문가라도 전문가에 상응하는 능력을 발휘할 수 있도록 쉽고도 빠르게 도움을 주는 시스템입니다.
- 보통 사용자 인터페이스, 지식베이스(지식 저장 공간), 추론 엔진(추론 규칙, 검색 전략 알고리즘)으로 구성되어 있습니다.
● 퍼지 논리 혹은 퍼지 이론은 명확하게 정의될 수 없는 지식(즉, 이진화를 할 수 없는 지식)을 표현하는 방법입니다.
- 이진논리(부울논리)는 1과 0, 춥다와 안 춥다.. 이진 분류인 것이죠.
- 퍼지 논리는 0~1.00~1.0 사이의 값을 가지며, 지식 표현의 애매성을 극복하고, 다차원적으로 표현합니다. 아주 추움 1, 다소 추움 0.7 , 약간추움0.4, 안 추움0.1 과 같은 다중 분류를 떠올리면 이해가 쉽습니다.
● 유전 알고리즘은 다윈의 진화론 중 적자생존에 기반한 최적화 연산 방법이라 할 수 있습니다.
- 최종적으로 살아남는 종은 변화에 가장 발 빠르게 적응하는 종입니다.
- 탐색 알고리즘의 일종으로 교차, 변형, 평가, 선택을 통해 좋은 해를 얻는 것을 진화라고 봅니다.
● 데이터 VS 인간의 직감. 소싯적 연애에 해박한 지식과 경험을 소유한 친구가 있었습니다. 그에게 물어보면 어떤 상황에서 어떻게 대비하며 대처해야 하는지 설루션이 제시되었습니다. 그는 이미 그 업계(?)에서 유명했고, 일주일 내내 점심은 친구들의 상담비용으로 충당되었습니다. 그는 문제에 접근할 수 있는 결정적인 데이터 포인트를 알고있었던 것이죠. 직관적으로요.
● 그런데, 이 직관의 성능이 좋다면 데이터과학과 컴퓨터의 힘은 굳이 필요할까 싶습니다. 데이터과학자는 건초더미에서 바늘을 찾고 이를 알리기 위해 데이터를 수집, 가공, 분석, 해석, 인사이트 도출, 의사소통까지 폭넓게 아우릅니다. 데이터 기반 의사결정을 한다는 건 인간의 직관을 서포트하기 위함입니다.
● 하지만, 이게 전부는 아닙니다. 인간의 직관과 통념이 잘못되었다는 것을 반증하기 위한 방법이라는 점이 덧붙여져야 합니다. 인간과 세상을 바라보는 새로운 관점을 제시할 수 있다면 데이터 과학과 컴퓨터의 힘은 필요하다 할 수 있습니다. 다음에는 데이터가 직관을 반증하는 사례를 한번 살펴보도록 하겠습니다.
● NBA에서 성공한 흑인선수들 중 가정형편이 어려웠던 자녀가 많았을까요? 아님 부유한 중산층의 자녀가 많았을까요?
● 많은 사람들은 르브론 제임스나 앨런 아이버슨 같이 불우한 가정형편에서 자란 사람들이 성취동기나 야망을 갖는데 더 도움을 얻었을 것이라는 통념을 대다수 가집니다. 그러나 데이터는 이를 반증합니다. 되려 중산층의 넉넉한 가정에서 안정적인 환경에서 자란 흑인 선수들이 성공확률이 높다 말해줍니다. 그 대표적인 예가 마이클 조던입니다. 아버지는 제너럴일렉트릭의 장비 관리자,, 어머니는 은행원이었죠.
● 사실 조던같이 승부욕 강하고,, 수직 점프력이 좋은 재능 있는 흑인 선수는 넘쳐납니다. 그러나 NBA에서 슈퍼스타가 되기 위한 절제와 태도, 마음가짐을 얻는것은 가정환경과 배경이 상당한 역할을 하는 것이 사실입니다. 조던은 인터뷰에서 이미 그가 성장기 가졌던 배경과 가정의 분위기에 감사하고 있음을 수차례 밝혔습니다. 데이터를 통해 세상과 인간을 바라보고, 예측하는 기계가 인공지능의 핵심이라 여긴다면, 굳이 이 기계가 설명이 가능해야 할까라는 순간의 의문이 들기도 합니다. 사람이 너무 인공지능에게 많은 의미를 부여하는 건 아닐까 하고요.
'AI(인공지능) 이야기' 카테고리의 다른 글
8번째 이야기 - 앨런튜링, 에니그마, 튜링테스트 (0) | 2022.09.04 |
---|---|
7번째 이야기 - 차원의 저주, 비전형적인 데이터, 강 인공지능 (0) | 2022.09.04 |
5번째 이야기 - 딥러닝 추론, 머신러닝, 전문가 시스템 (0) | 2022.09.04 |
4번째 이야기 - 무의식의 상관관계, 상식의 저주, 기호주의 (0) | 2022.09.04 |
3번째 이야기 - 인공지능, 인공지능 기술, 인공지능 사용 설명서 (0) | 2022.09.04 |
댓글