가장 센 인공지능은 ‘알파고Zero’…AI 행마 빨라, 이창호보다 조훈현과 닮은꼴
알파고 출현 이전부터 당시 최고 실력을 자랑했던 바둑프로그램 ‘ZEN’을 노트북에 설치해 한국기원 기자실을 드나드는 프로기사들을 골탕 먹이던 AI바둑 마니아다. 엘프고와 릴라제로 등 바둑AI가 나오면서 인공지능 탐구열은 더욱 불붙었다. 구할 수 있는 인공지능 바둑프로그램은 모두 섭렵했고, 지금도 1080Ti를 장착한 컴퓨터로 과거와 현재 대국을 복기하며 인공지능 수법을 연구하고 있다.
최근에는 프로기사와 협업해 AI수법을 이론화하는 작업을 이어가고 있다. 참신한 발상과 신선한 자극을 끊임없이 던져주는 AI 바둑이론이 바둑팬에게 잘 전달되지 않아 아쉽다고 말하는 AI바둑 전문가 김수광 기자에게 인공지능 바둑의 현재와 미래를 물었다.
이세돌-알파고 대결. 신의 한수로 불린 백78수가 나왔던 제4국 복기장면.
―인공지능 바둑은 어떤 방식으로 연구하나.
“수백 년, 수십 년 전 명국을 AI로 복기해 승부처를 살피거나 잘 알려진 포석을 인공지능에 넣어 재해석하며 데이터를 쌓는다. 고바야시류 포석, 3연성, 중국식 포석에 대한 AI의 시각은 아주 흥미롭다. 상식을 깨는 수를 찾을 때 특히 보람을 느낀다. 인공지능 수법에 의미를 탐구하는 건 고대 상형문자를 해독하는 느낌과 유사하다. 부지런히 기보를 넣어보고 공통점을 하나씩 엮어 의미를 추측해가고 있다. AI가 보여주는 유행수법은 ‘결과물’일 뿐이다. 연산과정 속 변천을 우리는 알 수 없다. 그래서 나는 과거 기보에 주목한다. AI는 우리가 과거에 쓴 수법들도 이미 학습을 거치고 결론을 내렸기 때문이다. 그 수법이 배제된 이유를 AI 참고도로 분석하면 인공지능이 의도하는 바를 추측할 수 있다.”
―AI 바둑이 보여주는 특징을 꼽는다면?
“행마의 속도가 다르다. 인공지능은 굉장히 발이 빠르다. 기풍으로 본다면 이창호 9단보다는 조훈현 9단에 가깝다. 또 어떤 때는 다소 무리로 보이는 변화를 강행해서라도 선수를 잡으려 하는 모습도 볼 수 있다. 예를 들면 어깨 짚음, 붙임수 등에 대한 인식이 달라졌다. ‘어깨 짚음’은 상대의 폭을 제한하는 용도 외에도 쓰임이 폭넓어졌다. 또 예전보다 이른 시기에 등장하는 특징이 있다. ‘붙임’수 의미가 달라졌다. 대체로 상대 돌에 붙여 가면 호흡이 격렬해진다. 과거 초반에는 선호하지 않았던 적극적인 수법이다. 두 수법 모두 선수잡기를 지향한다. 이창호 9단이 즐겼던 ‘기다림’이 지금 인공지능 시대에는 미덕이 아니다.”
―요즘 프로바둑에서 자주 나오는 삼삼 침입 수법에 대한 생각은 어떤가?
“삼삼 침입은 좋은 수다. 선수로 실리를 쉽게 확보한다는 장점이 뚜렷하다. 상대 응수에 따라 외벽에 약점을 다시 노릴 가능성도 있다. 대부분 AI는 가장 이길 확률이 높은 수법이라고 추천한다. AI는 상상을 초월하는 타개능력이 있다. 웬만한 곤마는 내버려 두고 다른 곳에서 득을 본다. 타개에 자신이 없는 사람은 삼삼도 몸에 맞지 않은 옷일 수 있다. 사실 삼삼 외에도 반상에서 초반의 정답이라고 꼽을 수 있는 좋은 수는 곳곳에 많이 있다. 초반 국면에서 다른 요처들도 AI로 분석하면 삼삼과 비슷한 승률이 나온다. 너무 삼삼에 구애받지 않고 자신의 바둑을 즐기라고 권하고 싶다.”
AI가 보여주는 중국식 포석 약점과 파훼법 [참고도 1. 중국식 포석과 약점] AI는 중국식 포석(흑 1, 3, 5)의 약점도 A 삼삼, B 어깨짚음, C 붙임이라고 제시한다. [참고도 2. 중국식 파훼법 ●알파고Lee ○알파고Zero] 구글에서 공개한 알파고 대국에서 발췌한 장면이다. 백은 선수로 우상 실리를 차지하고 백11로 외부 약점을 살짝 건드린다. 이후 우하귀는 13으로 붙여 가볍게 처리하고, 자연스러운 행마로 백23 어깨를 눌러간다. 흑 진영에서 백이 가벼우면서 활발한 모양을 갖췄다. 반면 흑은 애초에 중국식 포석(세모 표시)을 펼치며 기대했던 세력은 모두 사라지고 쪼그라든 실리 몇 줌 남았다. |
―현재 나와 있는 인공지능들 실력 순위는? 알파고Lee(이세돌과 대결했던 v18)-알파고Master(커제와 대결한 업그레이드 버전)-알파고Zero(바둑룰만 입력해 자가학습)와 기타 업체에서 나온 페이스북 ‘엘프고’, 중국 텐센트 ‘줴이’, 릴라제로 기력은 어느 정도 차이가 있나?
“신진서 9단은 ‘대부분 AI가 알파고Lee 수준은 능가했지만, 알파고Zero 수준보단 아래’라고 생각한다. 실력비교를 위해선 각 인공지능 특성을 알 필요가 있다. 엘프고를 만든 페이스북은 애초에 개발목표가 알파고Lee의 대중화였다. 엘프고는 딥마인드가 공개한 논문을 가장 충실하게 복제한 프로그램이어서 알파고Lee의 완성형이자 보급형이라고 보면 된다. 릴라제로는 엘프고와 대국 테스트를 거쳐 업그레이드한다. 당연히 엘프고보다 승률이 높고 더 안정적이다. 텐센트사가 개발한 중국AI 줴이(FineArt)는 개발 초기에 중국 위빈 감독이 알파고Master 수준이라고 말했는데 지금은 더 발전했으리라 예상한다. 굳이 순위를 추측하면 알파고Lee < 엘프고 < 릴라제로 ≦ 알파고Master ≦ 줴이 < 알파고Zero 정도로 나타낼 수 있겠다.”
―이세돌-알파고 대결 4국에서 구리 9단이 ‘신의 한수’라 이름 붙였다는 백78수를 최근 인공지능으로 분석하면 어떤 결과가 나오나.
“이미 국가대표팀 자체 연구에서도 밝혀졌지만 원래는 안 통하는 수였다. 백 78수를 최신버전 릴라제로에 넣어보면 30만 번 연산해도 백 승률이 13.8%에 그친다. 그 수 자체보다 이후 알파고가 받는 방법이 이상해서 바둑이 역전되었다. 알파고의 폭주를 유도한 수라고 의미를 둘 수는 있겠다, 당시 이세돌과 대결한 알파고 버전 18은 약간의 결함이 있었고, 개발자들도 이미 알고 있었다.”
이세돌 신의 한수, 최신 인공지능에선 승률 13.8% [참고도 3. 구글딥마인드 챌린지 매치 제4국 ●알파고 ○이세돌 180수 끝, 백불계승] 제4국 실전 진행이다. 참고도 백1이 유명한 신의 한수(실전 78수)다. 최신 인공지능 릴라제로는 흑6(실전 83수) 진행 대신 A로 갈무리하는 수를 추천한다. 이후 상변 백돌(세모 표시)이 다 살려줘도 흑이 많이 유리한 형세라고 참고도를 그려준다. 당시 알파고는 흑6을 시작으로 ‘오류’라고 불린 B(실전 97수)자리에 둘 때까지 이상행마를 보였다. 최신 AI로 분석해보니 4국 실전 83수부터 97수까지 승률이 52%가 하락했다. 당시 알파고 개발팀은 가치망에서 형세를 오판하고 있었다고 발표했다. 이후 버전 알파고에서 이런 결함은 모두 극복되어 인간이 AI를 이길 가능성은 완전히 사라졌다. |
―앞으로 AI와 바둑계 미래를 전망하면?
“인공지능을 통해 우리는 이미 미래의 바둑을 보고 있다. 한국기원 국가대표팀 목진석 감독은 ‘인공지능은 인간이 축적해 놓은 바둑이론을 극한으로 구현한다’라고 말했다. 정책망-트리서치-가치망으로 이어지는 알고리즘은 인간이 바둑을 둘 때 일감 찾기-수읽기-형세판단을 하는 과정과 크게 다르지 않다. 물론 AI는 상상하기 어려울 정도로 많은 연산 과정을 빠른 시간에 거치기에 인간보다 더 좋은 수를 둘 수 있다. 그 과정에서 창의적인 수법을 찾는다면 다시 연구해 우리의 이론에 흡수해야 한다. AI가 인간보다는 바둑의 ‘궁극’에 가깝게 다가갔을지 모르겠지만 그것은 궁극까지의 거리에 비하면 오십보백보일 것이다. 아직도 바둑에서 구현할 수 있는 변화와 경우의 수는 밤하늘의 별보다 많다. 어차피 신의 한수를 찾아 노력하는 입장이라면 AI는 인간의 동반자, 아니 조력자다. 지금은 통역자가 필요한 시점이다. AI와 소통하며 더 정밀한 이론을 구축하는 게 전문가가 맡은 역할이다. 나보다 앞으로 프로기사들이 해야 할 일이라고 생각한다.”
박주성 객원기자