Polaris와 Cepheus가 특히 부족한 곳은 No-Limit Hold’em이었습니다. Limit Hold’em은 모든 거리에서 더 많은 가능성을 가질 뿐만 아니라 상대방의 플레이 스타일에 적응하고 새로운 카운터 전략을 채택해야 합니다. 이것은 Polaris의 능력을 훨씬 넘어서는 것으로 포커 AI 연구원의 기준을 높였습니다.
그들의 첫 번째 시도는 최초의 무제한 헤즈업 봇인 Claudico였습니다. CMU(Carnegie Mellon University)의 과학자들이 디자인한 Claudico는 2015년 피츠버그의 Rivers Casino에서 열린 특별 행사에서 데뷔했습니다. AI는 Doug Polk, Dong Kim, Bjon Li 및 Jason Les와 같은 세계 최고의 헤즈업 포커 플레이어 4명과 대결했습니다. Claudico는 럭키 브레이크의 영향을 최소화하도록 설계된 설정에서 각각에 대해 20,000개의 핸드를 플레이했습니다. 80,000개의 핸드 후에 인간 플레이어는 700,000개의 칩으로 앞서 있었습니다. 경기 후 Polk는 봇이 특정 상황에서 우위를 차지했지만 말이 되지 않는 동작도 일부 수행했다고 언급했습니다. 예를 들어 비논리적인 상황에서 비정상적으로 크거나 작은 베팅을 할 수 있습니다. 평결: 인류는 여전히 앞서 있었습니다!
CMU 팀의 다음 차례는 Libratus였습니다. 2017년에 크게 업그레이드된 이 제한 없는 봇은 Claudico 경기의 Les와 Kim, Jimmy Chou와 Daniel McAulay를 상대했습니다. 이번에는 총 120,000개의 핸드가 플레이되었습니다(핸드가 많을수록 통계적으로 더 관련 있는 결과가 나옵니다.) $200,000의 상금 풀도 있었습니다. 불행히도 인간에게는 Libratus가 Claudico보다 훨씬 뛰어났고, 게임을 플레이하지 않을 때 매 초마다 게임을 분석하고 전략을 연마했습니다. 결국 Libratus는 170만 칩으로 모든 인간 플레이어를 이겼습니다(Dong Kim이 최선을 다해 85,000에 불과했습니다.). -위로. 대부분의 온라인 포커 플레이어는 여전히 숨을 쉴 수 있습니다.
6-max 포커 대 AI
그런 다음 Pluribus가 왔습니다. 이번에 CMU는 Facebook AI 연구소와 협력하여 6-max 노리밋 포커를 플레이할 수 있는 봇을 고안했습니다. 그들의 접근 방식은 AI에게 텍사스 홀덤을 플레이하도록 가르치고 스스로 플레이하도록 하는 것입니다. Pluribus는 2019년 두 차례에 걸쳐 실력을 뽐냈습니다. 첫 번째 라운드에서 Pluribus는 12일 동안 5명의 플레이어(각각 100만 달러 이상의 상금)를 상대로 10,000 핸드를 플레이했고 4800만 대의 승률을 기록했습니다. 게임당 블라인드(즉, 최고의 플레이어보다 몇 개의 빅 블라인드가 1,000개 이상의 핸드를 얻을 것으로 예상되는지). 두 번째 라운드에서 포커 스타 Chris Ferguson과 Darren Elias는 Pluribus의 5가지 다른 반복을 상대로 각각 5,000개의 핸드를 플레이했습니다. 두 번 모두 봇이 정상을 차지했습니다. 마침내, 봇들은 무패의 챔피언을 갖게 되었습니다!