뮤제로1 9번째 이야기 - 뮤제로, 알파제로, 알파고, 알파고 제로 ● 사실 뮤제로는 체스, 바둑, 장기에서는 '알파제로''알파 제로'와 비슷한 경기력을 보이나, 아타리 게임에서는 이전의 모든 알고리즘보다 우수한 실력을 발휘합니다. 사실 뮤제로의 큰 장점은 데이터를 매우 경제적으로 사용한다는 것입니다. 훈련량에 비해 성능이 금세 좋아진다는 것이죠. 그 비결은 무엇이었을까요? 그것은 각 의사결정 단계에서 중요한 측면만을 고려한 덕분입니다. 딥마인드의 표현처럼 "우산이 당신을 젖지 않게 해 줄 거라는 걸 아는 것이 비가 내리는 패턴을 파악하는 것보다 더 유용합니다." ● 의사결정단계에서 가장 중요한 것만 모델링에 반영하는 알고리즘의 방식이 이 모든 차이를 낳은 것입니다. 중요한 것이 무엇인지를 알 수 있다는 건 학습의 효과에 퀀텀 점프를 낳게 합니다. 딥마인드의 인공지능은 .. 2022. 9. 4. 이전 1 다음