본문 바로가기

댓글0
번역beta

Translated by kakao i

번역할 언어 선택

뷰 본문

BBC News | 코리아

인간을 속이는 법까지 배운 인공지능을 어떻게 활용할까

플러리버스는 속임수에 능해야 하는 포커에서 인간 경쟁자 다수를 동시에 꺾은 최초의 로봇이다.

4,028 읽음
댓글0
번역beta

Translated by kakao i

번역할 언어 선택

인공지능이 잘 쓰여서 인류에게 도움이 될 수는 없을까?

출처Getty Images

체커, 체스, 단어 보드게임 스크래블 등등… 세계에서 가장 인기 있는 게임들을 컴퓨터가 차례차례 정복하고 있다.

최근에는 허세(블러핑) 전략도 써야 하는 포커마저 컴퓨터에 정복당했다.

지난 7월 12일, 플러리버스라는 포커 로봇이 세계 최정상급 프로선수들을 모두 물리쳤다. 게임은 '노 리미트 텍사스 홀덤'이라는 가장 보편적인 방식으로 진행됐는데, 로봇이 여러 명의 인간을 동시에 꺾은 것은 이번이 처음이다.

이 소식에 아마도 온라인 포커 플레이어들은 울상을 지을지도 모른다. 하지만 이 인공지능이 잘 쓰여서 인류에게 도움이 될 수는 없을까?

컴퓨터에게는 너무 어려운 포커

수십년 동안, 머신러닝 입장에서 포커는 "너무 복잡한 게임"으로 여겨졌다.

눈앞에서 패가 움직이는 체스와 달리 "불완전한 정보"의 게임이라는 것이다. 특히 포커에는 히든카드라는 규칙이 있다. 플레이어들이 현재 게임 상황을 파악하는 데 사용할 정보가 부분적일 수밖에 없는 것이다.

노암 브라운(우측)이 봇 개발에 힘썼다

출처CMU

여기에 포커는 자신이 가진 카드의 가치를 숨기기 위한 허세 전략이 난무한다.

인공지능(AI)가 포커에서 애를 먹은 것은 이 때문이다.

무너진 경계

그럼에도 포커에서 인간의 우위가 이제는 무너졌다.

플러리버스가 문제를 푼 것이다. 이 로봇은 페이스북 AI 연구팀의 노암 브라운 박사와 카네기멜론대 컴퓨터과학과 튜오마스 샌드홀름 교수가 공동으로 개발했다.

플러리버스는 포커 누적상금으로 100만 달러 이상을 기록 중인 13명의 프로 선수들과 붙었다. 상대 중에는 월드 포커 투어(World Poker Tour) 4회 우승 기록을 보유한 대런 엘리아스도 있었다. 이들과의 게임에서 플러리브스는 수천 가지의 패를 사용해, 정상을 차지했다.

2012 월드 시리즈에서 시구한 프로 포커 선수 그렉 머슨

출처Getty Images

현실에서 활용

과학자들은 대체 인간을 이기는 기계를 왜 연구하는 것일까?

거두절미하면, 그들에게는 체스나 포커를 통해 인공지능이 더 복잡한 과업을 수행할 수 있게 훈련된다는 믿음이 있다.

브라운 박사는 BBC 인터뷰에서 "포커는 보다 근본적인 문제를 해결하기 위한 벤치마크"라며 "감춰진 정보에 대처하는 AI를 발전시키는 것이 목표"라고 말했다.

"현실에 활용하고 인간이나 다른 AI와도 상호작용을 하는 AI를 만들려면, 다른 구성원들이 세계를 보는 방식이나 그들이 다른 정보를 가질 수 있다는 것을 이해해야 합니다."

그는 "포커는 이를 위해 대단히 훌륭한 모의 실험장치"라고 덧붙였다.

알파고의 개발자들은 알파고가 화학이나 엔지니어링 영역에서 새로운 물질을 탐구하는데 쓰일 수 있다는 기대를 내비쳤다

출처Getty Images

2015년 구글이 소유한 딥마인드의 알파고가 처음으로 프로 바둑 선수를 이겼다. 당시 알파고의 개발자들은 알파고가 화학이나 엔지니어링 영역에서 새로운 물질을 탐구하는 데 쓰일 수 있다는 기대를 내비쳤다.

브라운 박사와 샌드홀름 교수는 플러리버스의 문제 해결 능력이 훗날 금융 협상이나 자율주행차 길 찾기에 도움될 것이라 믿고 있다. 두 분야는 복수의 참여자들이 존재하고 정보가 불완전한 상황이라는 공통점이 있다.

샌드홀름 교수는 "정보가 불완전한 게임을 통해 현실과 가장 비슷한 설정에서 테스트할 수 있다"고 말했다.

샌드홀름(가운데) 교수의 AI 전문회사 스트레티지 로봇이 2018년 8월 미 육군으로부터 1000만달러 계약을 수주했다

출처CMU

로봇은 어떻게 배우나

과학자들의 이상과 현실에는 아직 커다란 격차가 있다. 2년 전 리브라투스라는 또 다른 포커 로봇이 피츠버그 카지노에서 1대1로 인간을 꺾은 적이 있다.

전문가들은 로봇의 게임 전략이 군사적 목적으로 활용될 수 있다고 주장했다. '와이어드' 지는 샌드홀름 교수의 AI 전문회사 스트레티지 로봇이 2018년 8월 미 육군으로부터 1000만달러 계약을 수주했다고 보도했다.

"퍼펙트 베트(한국명: 수학자는 행운을 믿지 않는다)"라는 책을 쓴 수학자, 아담 쿠차르스키는 "로봇은 의사 결정에 관해서 인간에게 많은 것을 가르쳐줄 수 있을 것"이라고 했다.

"최고의 포커 로봇은 후회를 최소화하는 과정을 통해서 학습합니다. 결정을 내리고 '만약 내가 다른 결정을 했다면 어떻게 됐을까'라고 이를 되짚어보는 거죠."

그는 "로봇에게 지면서 인간 역시 본인의 게임 전략에 대해 더 많이 배울 수 있다"고 덧붙였다.

전문가들은 로봇의 게임 전략이 군사적 목적으로 활용될 수 있다고 주장했다

출처Getty Images

"로봇의 허세"

그렇다면 플러리버스는 어떻게 허세 전략을 사용할까?

개발팀은 이 로봇이 자신을 상대로 수조 개에 달하는 패를 내게 했다. 그리고 그 전략을 검토하는 식으로 학습시켰다.

그 과정에서 승리로 이어진 결정은 향후 활용 빈도가 높은 것으로 분류했다.

이러한 결정들에는 약한 패로 배팅해서 상대를 포기하게 만든 것, 즉 허세 전략이 있었다.

브라운 박사는 "사람들은 허세 전략이 대단히 "인간적인" 요소라서 기계는 하지 못하리라 생각한다"고 말했다.

"하지만 사실 기계도 허세를 부릴 수 있고, 심지어 훨씬 더 잘하기도 합니다"

출처Getty Images

"하지만 사실 기계도 허세를 부릴 수 있고, 심지어 훨씬 더 잘하기도 합니다."

그는 "플러리버스는 허세를 속임수가 아니라, 나쁜 패로도 최대한의 돈을 벌 수 있는 행동으로 간주한다"고 설명했다.

플러리버스는 작동에 돈이 많이 들지도 않는다. 카네기멜론대 연구자들에 따르면, 이 AI를 작동시키는데 150달러(약 18만 원)짜리 클라우드 컴퓨터가 사용된다. 반면 딥마인드는 5000여 개의 특수 프로세서를 갖춘 수백만 달러 슈퍼컴퓨터를 사용한다.

DO NOT DELETE - DIGIHUB TRACKER FOR [49091753]

작성자 정보

BBC News | 코리아

    실시간 인기

      번역중 Now in translation
      잠시 후 다시 시도해 주세요 Please try again in a moment