본문 바로가기

강인공지능2

9번째 이야기 - 뮤제로, 알파제로, 알파고, 알파고 제로 ● 사실 뮤제로는 체스, 바둑, 장기에서는 '알파제로''알파 제로'와 비슷한 경기력을 보이나, 아타리 게임에서는 이전의 모든 알고리즘보다 우수한 실력을 발휘합니다. 사실 뮤제로의 큰 장점은 데이터를 매우 경제적으로 사용한다는 것입니다. 훈련량에 비해 성능이 금세 좋아진다는 것이죠. 그 비결은 무엇이었을까요? 그것은 각 의사결정 단계에서 중요한 측면만을 고려한 덕분입니다. 딥마인드의 표현처럼 "우산이 당신을 젖지 않게 해 줄 거라는 걸 아는 것이 비가 내리는 패턴을 파악하는 것보다 더 유용합니다." ● 의사결정단계에서 가장 중요한 것만 모델링에 반영하는 알고리즘의 방식이 이 모든 차이를 낳은 것입니다. 중요한 것이 무엇인지를 알 수 있다는 건 학습의 효과에 퀀텀 점프를 낳게 합니다. 딥마인드의 인공지능은 .. 2022. 9. 4.
7번째 이야기 - 차원의 저주, 비전형적인 데이터, 강 인공지능 ● 경마장을 질주하는 훌륭한 경주마는 상당한 고가입니다. 우승 가능성이 있는 훌륭한 말을 볼 수 있는 눈을 가진 전문가나 팀이 존재합니다. 대체 훌륭한 경주마를 선택하는 데 있어 결정적인 특성(Feature)은 무엇일까요? 또 그 특성은 대체 어떻게 알아내는 것일까요? 경마를 위해 공개되는 두 살 난 말의 경우 공개된 1,000마리 중 고작 5마리 정도만이 우승을 한다고 합니다. 그렇다면 나머지 말들은 어떻게 도는 것일까요? ● 세스 스티븐스 다비도위츠(2018)에 따르면 3분의 1은 경주를 하기에는 느린 말로 판명된다고 합니다. 다른 3분의 1은 달릴 대의 엄청난 압력으로 인해 부상을 입고, 나머지 3분의 1은 바틀비 증후군 증상을 일으킨다 합니다. 즉, 정신차리고 보니 "내가 왜 달려야 하지? 달리고.. 2022. 9. 4.