알파고 이세돌 승리 원인, 패배 원인 resign _바둑 대형 바꿔치기, 몬테카를로 기법 확률적 한계
알파고 vs. 이세돌 간의 세기의 바둑 4국에서 이세돌이 극적 승리를 거두었다. (2016년 3월 13일)
이세돌이 승리하고, 알파고(alphago)가 패배한 이유는 무엇일까?
알파고에게 오류가 있었던 것일까, 아니면 이세돌이 너무나 잘 두었던 것일까?
결과적으로 이세돌이 잘 두었기 때문이지만, 이세돌도 의도하지 않았던 인공지능(AI)의 한계, 특히 알파고의 한계가 드러났기 때문이다.
그 원인을 분석해 보자.
<알파고, 슈퍼컴은 초반부터 두는 것이 유리하다.>
1. 알파고는 첫 수부터 바둑 집을 계산하고 들어간다.
알파고는 바둑을 두는 첫 수부터 집 계산을 하고 들어간다. 매 수마다 빠른 계산능력을 활용하여, 집 계산을 철저하게 한다.
즉, 슈퍼컴은 집을 정확하게 계산하고 착수를 하기 때문에, 첫 수부터 슈퍼컴과 대결하게 되면, 슈퍼컴을 쉽게 이기기는 힘들다.
슈퍼컴 자신이 계산한 바대로, 슈퍼컴 자신이 자신의 판세를 이끌어가기 때문이다.
2. 만일 슈퍼컴이 최후의 수부터 둔다면, 슈퍼컴이라고 하더라도 판세를 뒤집을 순 없다.
만일, 이미 바둑을 거의 다 둔 상태에서, 슈퍼컴에게 마지막 한 수만을 남겨두고 이를 두게 한다면, 슈퍼컴이더라도 바둑의 판세를 뒤집을 수는 없다.
이미 두어진 바둑판이 바뀔 수 없는 주어진 전제 조건으로 작용하기 때문이다.
3. 만일 슈퍼컴이 최후의 수부터 -1번째, -2번째, -3번째, ..., -n번째, 이런 식으로 최초의 수부터 둔다면, 슈퍼컴이 이길 가능성은 계속 올라간다.
하지만, 슈퍼컴이 최후의 한 수(X번째)로부터 점점 시점을 당겨서, X-1번째, X-2번째, X-3번째, ..., X-n번째, 이런 식으로 해서, 최초의 수부터 두게 된다면, 슈퍼컴이 이길 가능성은 계속 올라가게 된다.
왜냐하면, 바둑판에 이미 두어진 돌이 점점 줄어들고, 슈퍼컴이 시뮬레이션하여 계산하여, 판세를 슈퍼컴이 계산한 바대로 이끌어갈 수 있는 가능성은 계속 올라가기 때문이다.
4. 바뀔 수 없는 주어진 전제 조건이 확대될 수록, 슈퍼컴이라도 판세, 승패를 뒤집을 수는 없다.
즉, 바둑판에서 이미 두어진 돌이 많은 상황부터 슈퍼컴이 중간에 개입할 수록, 슈퍼컴이라도 판세를 뒤집을 가능성은 점점 줄어든다는 것이다.
<중간에, 슈퍼컴 자신이 계산해 왔던 상황이, 예상치 않게 갑자기 바뀌면 어떻게 될까?>
- 슈퍼컴 알파고의 한계, 이세돌 승리원인, '대형 바꿔치기'
만일 초반부터 알파고, 슈퍼컴이 계산한 바대로 잘 두고 있었는데, 예상치 못하게 중간에 판세가 바뀌면 어떻게 될까?
엄청난 슈퍼컴인데, 예상하지 못한 상황이 발생할 수 있을까?
적어도 이세돌 vs. 알파고 와의 세기의 대국 4국에서는 이런 상황이 발생했다고 할 수 있다.
왜 발생했는지 생각해 보자.
1. 이세돌, 78수 이전에 이미, 우중앙, 우상변에서 '대형 바꿔치기' 시도해서 통했다
슈퍼컴은 첫 수부터 매 수마다 집 계산을 해서 착수를 한다고 했다.
이세돌이 78수에서 묘수를 둔 상황 이전에 이미 슈퍼컴에게 중대한 조건 변화가 발생했다는 것이다.
그 원인은 이세돌이 우중앙,우상변에서 시도한 대형 집바꾸기, 즉, '대형 바꿔치기'에 있다.
슈퍼컴은 이미 예상되는 집을 계산하고, 세력을 형성하고 있었는데, 이세돌이 대형으로 예상되는 집을 바꿔치기 하니까, 알파고로서도 갑자기 예상되는 집 계산을 다시 하게 된 것이다.
즉, 슈퍼컴 알파고가 첫 수부터 초중반까지 이어오던 착수의 흐름이 크게 단절되 버린 것이다.
물론, '대형 바꿔치기' 이후에도, 알파고는 매 수마다 계산해서 또 착수를 하면 된다. 하지만, 이세돌이 '대형 바꿔치기'를 시도한 이후로는, 첫 수부터 바꿔치기 이전까지 알파고가 놓았던 수순이 '완벽한 것'이 되지는 못한 것이다.
2. 몬테카를로 통계 기법의 한계
몬테카를로 기법은 통계적으로 확률적 기법을 동원하여, 확률적으로 가장 가능성 높은 수를 찾아 나서는 것이다.
이세돌이 '대형 바꿔치기'를 시도하기 직전까지, 알파고는 확률적으로 가장 가능성 높은 수를 찾아서 착수를 하였으나, 이세돌의 '대형 바꿔치기' 이후로는, 그 직전까지의 수가 '확률적으로 가장 가능성 높은 수'가 되지 못한 것이다.
즉, 주어진 전제조건이 '대형 바꿔치기'로 갑자기 초중반 대국이후로 바껴버린 것이다.
마치 첫 수부터 착수를 하던 슈퍼컴이 그 흐름이 단절되고, 초중반부터 이미 돌이 두어진 상태에서 중반부터 대국을 시작하게 된 것이나 같다.
자신이 지금껏 계산해 왔던 집계산이 급작스럽게 변경되는 이런 상황은 적어도 알파고, 슈퍼컴이 예상치 못했던 상황이라고 할 수 있고, 그게 아니어도, 적어도 아주 가능성이 희박한 극소한 확률의 수로 본 것임에 분명하다.
즉, 이세돌이 '대형 바꿔치기'를 먼저 시도했기 때문에, 대국 흐름에서 틈이 발생한 것이다.
이 대국 흐름의 틈에서, 이세돌이 78수라는 묘수를 발견하여 실행에 옮긴 것이라 볼 수 있다.
3. 급작스런 상황변화, 우발적 상황변화가 이미 주어진 전제 조건을 변화시킨다
슈퍼컴 알파고는 확률적 기법에 따라, 가장 승산이 높은 수를 따라 매번 착수를 진행한다.
알파고가 착수한 모든 수는 그 수를 놓을 때까지는 가장 승산이 높은 수이고, 따라서 다음 수를 놓았을 때도 높은 승률을 보장하는 수이다.
이세돌이 중간에 '대형 바꿔치기'를 시도하기 이전까지는 그게 맞았다.
하지만, 이세돌이 중간에 '대형 바꿔치기'를 시도하여, 슈퍼컴 알파고가 계산해 온 판세 흐름이 일거에 뒤바뀐 것이다.
즉, 아주 가능성을 희박하게 본 급작스러운 상황변화, 우발적 상황변화가 이미 형성돼 있던 판세 계산 흐름을 일거에 뒤바꿔 놓은 것이다.
이는 마치 중간부터 슈퍼컴이 대국을 시작하게 된 것과 같다.
4. 중간부터 슈퍼컴이 시작한다고 하더라도, 슈퍼컴이 이길 확률은 여전히 높지만, 틈이 존재한다.
이 틈을 이세돌이 78수 묘수를 통해 찾아낸 것이다.
즉, 이번 대국에서 이세돌의 승리원인은 바둑에서 큰 집을 서로 맞바꾸는 '대형 바꿔치기'에 있었다고 볼 수 있다.
그것도 대국 초반이나, 대국 종반이 아닌, 대국 초중반에 시도됐기 때문에, 이세돌로서도 승리의 가능성을 보장받았다고 볼 수 있다.
<알파고 슈퍼컴, 몬테카를로 기법, 통계적 확률적 기법 한계>
이번 대국은 알파고, 몬테카를로 확률 기법의 한계를 보여준다. (Monte Carlo method)
알파고가 이번에 진 이유는 이세돌(Lee Sedol)이 시도한, 대국 초중반의 '대형 바꿔치기' 때문이다.
중간에 백집, 흑집 예상이 갑자기 바뀌니까, 초반부터 중반까지 해오던 집계산을 알파고 슈퍼컴이 다시 하게 된 것이다.
즉, 주어진 전제가 갑자기 뒤바껴버린 것이다.
이는 몬테카를로 통계기법, 확률적 기번의 한계이기도 하다.
인공지능이 급작스런 돌발상황, 예상하지 못한 우발상황, 가능성 낮다고 판단한 희소상황에서는 완벽히 대응할 수 없다는 한계점을 시사한다.
알파고는 처음 1수부터 이미 집을 예상해서 계산하면서 착수에 들어간다. 그런데 알파고가 마지막 종반전의 최후 한 수만을 두게 한다면, 슈퍼컴도 주어진 판세를 뒤집을 수는 없다.
이런 식으로 본다면, 슈퍼컴 알파고는 초반부터 착수를 진행하는 게 유리하다. 하지만, 슈퍼컴이 중반부터 돌을 두게 된다면, 자신이 스스로 판세를 형성할 가능성은 점점 떨어진다. 이미 바둑판에 돌이 상당히 놓여져 있기 때문이다. 전제조건, 불변상황이 그만큼 많이 생성돼 있기 때문이다.
만일 슈퍼컴 자신이 전제상황, 혹은 가능성이 아주 떨어지는 불변상황이라고 본 상황이 갑자기 뒤바뀌게 되면 어떻게 될까?
이세돌은 초중반에 '대형바꿔치기'를 통해, 기존에 슈퍼컴 알파고가 형성한 판세 흐름을 일거에 바꿔놓았다.
물론, 이후에도 슈퍼컴 알파고는 여전히 이길 수 있었으나, 마치 중간부터 돌을 두기 시작한 것처럼, 기존에 자신이 두었던 집들은 완벽하지 않은 것이 돼 버린 것이다.
슈퍼컴 알파고는 이 때부터 집계산을 다시해야 했다. 이 때부터 알파고는 새로운 판세에서 대국을 두게 된 것이다.
물론 이후에도 알파고는 이길 수 있으나 완벽하게 이길 수는 없게 된 것이다. 그 틈을 이세돌이 찾은 것이다.
이는 몬테카를로 통계적 확률적 기법의 한계, 인공지능의 한계를 보여준다.
갑자기 주어진 전제조건이 뒤바껴 버리거나,
확률적으로 아주 극소하다고 판단했던 상황이 발생하거나,
혹은 우발상황이 발생하면,
인공지능(AI)은 제대로 작동하지 않을 수 있다.
예를 들어, 지구에 운석이 떨어지면, 인공지능 슈퍼컴은 운석에 맞아서 제대로 작동하지 않을 것이다.
예를 들어, 도로를 자동주행하도록 돼있는 슈퍼컴인데, 도로자체가 지진을 맞아서 없어지면, 슈퍼컴은 제대로 작동하지 않을 것이다
즉, 바둑판이기는 하지만, 전제가 갑자기 뒤바뀌는 상황, 예상할 수 없었던 상황에서 인공지능은 여전히 한계를 지닌다는 것을 반증한다.
특히 몬테카를로 기법이더라도 확률적으로 의존하기 때문에, 희박한 상황은 여전히 발생할 수 있다는 것을 의미한다.