본문 바로가기
Data Science & AI/AI

The Imitation Game and Turing Test

by 삼SAM 2024. 1. 9.

이미테이션 게임과 튜링 테스트

오늘날, 이미테이션 게임과 튜링 테스트는 일반적으로 동일한 것으로 간주되고 있다.

 

1950년, 앨런 튜링의 논문, " COMPUTING MACHINERY AND INTELLIGENCE"에서 소개된 이미테이션 게임은 이후 해당 논문의 저작자의 이름을 딴 튜링 테스트로 불리고 있다.

 

이미테이션 게임은 튜링의 논문 이전에도 있었다는 의견들이 있으나 그에 대한 명확한 근거는 확인하지 못하였다.

 

다만, 튜링의 논문에서 정의하는 이미테이션 게임과 일반적으로 생각하는 튜링 테스트 사이에는 약간의 차이가 있다.

 

이번 글에서는 각각이 무엇인지, 차이가 무엇인지 다루고자 한다.

 

앨런 튜링의 이야기를 다룬 영화 '이미테이션 게임'의 포스터

이미테이션 게임

앞서 언급한 튜링의 논문에서는 소개된 이미테이션 게임은 아래와 같다.

(이해를 돕기 위해 논문 내용보다 규칙은 간결하게, 진행 예시는 각색을 통해 보다 명확하게 작성하였다.)

규칙

  • 남성 참가자, 여성 참가자, 심문자(성별 무관) 이렇게 3명으로 나뉘어 진행되는 게임.
  • 심문자는 다른 두 참가자와 격리된 곳에서 참여한다.
  • 심문자는 각 참가자들에게 질문을 하여 누가 남자이고, 누가 여지인지 맞추는 것을 목표로 한다.
  • 한 명의 참가자는 심문자가 정답을 맞히지 못하도록 유도하고 다른 한 명의 참가자는 심문자가 정답을 맞히도록 유도하는 것을 목표로 한다.
  • 참가자의 목소리 톤이 힌트가 되는 것을 방지하기 위해 심문자의 질문에 답변은 제 3자 혹은 문자를 통해 전달한다.

 

진행 예시

 

심문자: 참가자 A, 당신의 헤어스타일을 말씀해 주세요.

 

참가자 A(남자): 60cm가 넘는 긴 생머리이며, 양 갈래로 딴 머리를 하고 있습니다.

 

참가자 B(여자): 그는 지금 거짓말을 하고 있습니다. 믿지 마세요. 제가 여자입니다.

 

(중략)

 

심문자: 참가자 A가 여자이고 B는 남자입니다.

 

참가자 A의 승리, 참가자 B, 심문자의 패배로 게임 종료.

 

튜링 테스트

튜링 테스트라는 용어는 해당 논문에서 등장하지 않는다. 해당 논문에서는 이미테이션 게임의 참가자 중 한 명을 기계(디지털 컴퓨터, 인공지능)로 대체하여 심문자가 누가 기계인지, 누가 사람인지 맞추는 방식으로 변경했다. 이러한 방식은 튜링의 의해 제안되었기 때문에 튜링 테스트로 불리고 있다.

 

결론적으로 인공지능이 사람과 구분되지 않을 정도로 대화가 가능한지 여부를 판별하는 테스트로 알려져 있다.

 

규칙

  • 이미테이션 게임과 동일한 규칙을 적용한다.
  • 단, 심문자가 아닌 참가자 중 한 명을 인공지능으로 대체하며 이에 따라 각 참가자의 목적이 수정된다.
  • 심문자의 목적은 누가 사람인지, 인공지능인지 맞히는 것이다.
  • 인공지능의 목적은 심문자가 틀리도록(자신이 인간이라고 생각하도록) 유도하는 것이다.
  • 인간 참가자의 목적은 심문자가 정답을 맞히도록 돕는 것이다.

 

진행 예시

심문자: "바람"을 주제로 시를 써보세요.

 

참가자 A(인간): 갑자기 시를 쓰는 것은 너무 어렵네요.

 

참가자 B(인공지능): 바람이 부는 곳에서 나는 항상 자유롭다. (후략)

 

(중략)

 

심문자: 1024 더하기 1024는?

 

참가자 A(인간) : 2048입니다.

 

참가자 B(인공지능) : 1024 더하기 1024는 2048이 맞습니다. 인공지능이 빠르게 답을 맞췄네요.

 

심문자: 시를 쓰는 등의 창의적인 활동을 어려워하고 계산이 빠르고 정확한 것을 보아 참가자 A가 인공지능입니다.

 

인공지능의 승리, 사람의 패배로 종료된다.

 

 

결론

규칙면에서 결국 심문자가 A와 B의 정체를 맞히고, 각각 A와 B는 심문자를 돕거나 방해하는 역할은 한다는 점에서 둘은 모두 이미테이션 게임이라고 볼 수 있을 것이다.

 

그러나 굳이 구분하자면, 우리가 말하는 튜링 테스트의 목적이 인공지능을 평가한다는 점에 초점이 맞추어져 있다는 점을 감안하면 이미테이션이 곧 튜링 테스트라고 말할 수는 없을 것이다.

 


 

댓글