1인칭 게임 '퀘이크 3 아레나' 학습…연구결과 '사이언스'에 발표

[중소기업뉴스=이준상 기자] 뛰어난 기력(棋力)을 지닌 바둑 인공지능(AI) '알파고'를 내놓아 세계를 놀라게 한 구글 딥마인드가 이번에는 여럿이 함께하는 게임에서도 인간의 능력을 뛰어넘는 게임 AI를 공개했다.

이 게임 AI는 여러 플레이어와 경쟁하고 협력하는 1인칭 게임에서 스스로 학습해 높은 수준의 게임전략을 세우고 다른 플레이어와 협력하며 사람과 대결에서 실력을 뽐냈다.

바둑과 체스처럼 게임 전체 정보가 제공되고 1대 1로 겨루는 게임뿐 아니라 시간에 따라 제한된 정보만 파악할 수 있고 다른 플레이어와 함께 하는 게임에서도 AI가 인간을 능가하는 능력을 보일 수 있음을 증명한 결과다.

구글 딥마인드의 창업자인 데미스 허사비스 최고경영자(CEO)와 이 회사 소속 연구원들은 "게임 AI 'FTW(For The Win) 에이전트'를 개발해 실전에서 실력을 확인했다"고 31일 국제학술지 '사이언스'(Science)에 발표했다.

FTW 에이전트는 1999년 출시된 1인칭 게임 '퀘이크 3 아레나'에서 깃발 뺏기 모드로 스스로 게임 방식을 배우고 전략을 고도화하면서 상대와 승부를 겨룰 수 있게 설계됐다. 게임은 바둑과 달리 두 플레이어가 팀을 이뤄 진행하는데 상대 진영의 깃발을 뺏으면 승리한다.

1인칭 게임인 만큼 플레이어의 시야가 제한되는 것도 바둑과 차이점이다. 플레이어는 바둑판을 볼 때처럼 전체 상황을 파악할 수 없고 캐릭터가 움직일 때마다 새로 발생하는 정보를 바탕으로 게임을 풀어가야 한다.

딥마인드 연구진은 앞서 개발된 바둑 AI '알파고 제로'처럼 강화학습을 통해 게임을 수행하는 게임 AI를 개발했다. 화면만 주고 게임을 진행하며 AI가 스스로 게임의 이치를 터득하게 하는 방식이다.

점수를 높이는 수가 어떤 것인지 데이터를 쌓으며, AI는 게임을 이해하는 수준이 차차 높아지게 된다. 다만 팀 경기인 만큼 플레이어의 성과뿐 아니라 팀의 성과에 따라서도 보상을 받도록 강화학습 알고리즘을 설계했다.

45만판의 게임을 학습하면서 FTW 에이전트는 실력을 쌓았다. 연구진에 따르면 에이전트끼리 수비와 공격을 나눠 맡는 등 팀워크를 발휘하는 전략을 개발해냈다. 사람 수준으로 반응 속도를 떨어뜨리더라도 AI는 사람 플레이어보다 우수한 성적을 냈다.

연구진은 논문에서 "강화학습을 통해 복잡한 기능을 수행하는 멀티에이전트를 개발할 수 있다"며 "이 분야의 잠재성이 크다는 것을 시사하는 결과"라고 의의를 밝혔다.
 

저작권자 © 중소기업뉴스 무단전재 및 재배포 금지