El Poker ha sido siempre considerado un juego de azar, pero la realidad es otra muy distinta, siendo este, un juego en el que desempeña un papel muy importante la habilidad o técnica, en conjunción con un pequeño componente azaroso.
Un equipo de la Universidad Carnegie Mellon en Estados Unidos de América, formado por Tuomas Sandholm y Noam Brown ha creado a partir de un software anterior desarrollado por Sandholm denominado Libratus, concebido para jugar partidas de poker de dos jugadores, es decir mano a mano, ya que es el modo tradicional de medir el progreso de la inteligencia artificial, recordemos la hazaña del software Deep blue que ganó a Gary Kasparov al ajedrez. Libratus mostró una eficacia extrema en partidas Head-up, (dos jugadores), ganó a Jason Lee en el torneo Rivers del casino de Pittsburg rozando la perfección con un ratio de victorias de casi el 100 % en 120.000 manos jugadas. El nuevo software, llamado Pluribus, creado por Sandholm y Brown tiene varias particularidades que hacen de él un arma temible, hasta el punto que el algoritmo no va a ser publicado por temor al daño que pudiera producir en el sector del juego online. Estas características son:
- Capaz de vencer a varios jugadores humanos de primer nivel sentados a la misma mesa.
- Juega con parte de la información, las cartas ocultas de los jugadores.
- Es capaz de aprender de sí mismo.
- Habilidades similares a las humanas, analiza a sus oponentes, les engaña en base a esta información.
- No está claro si cuenta con una única estrategia óptima o varias, conocidas como "equilibrio de Nash". El equilibrio de Nash es una lista de estrategias, una para cada uno de los jugadores, en la que ningún jugador puede mejorar desviándose a una estrategia diferente.
- Exploración de las posibles permutaciones para cada una de las cartas repartidas, lo que reduce la búsqueda a un conjunto de datos manejable.
- Algoritmo de búsqueda capaz de buscar el final del juego en partida de hasta seis jugadores.
- Habilidad para tomar decisiones en condiciones inciertas, según la teoría de juegos, lo que supera con creces el análisis de las posibles permutaciones brutas.
- Capaz de acabar una ronda de apuestas con call y comenzar la siguiente con raise, subiendo las apuestas.
- A destacar que mientras los anteriores software de inteligencia artificial necesitaban un superordenador para implementarse, Pluribus se ejecuta desde un único servidor, lo que le hace menos pesado, y má agil y rápido.
El programa jugó en la modalidad de Poker Texas Holdem sin límite de seis jugadores de primer nivel, entre quienes se encontraban:
- Darren Elias, récord de títulos ganados en el World Poker Tour.
- Chris "Jesús" Ferguson, ganador de seis títulos de la serie mundial de Poker, y ganador además frente a un bot de inteligencia artificial inferior a Pluribus.
- Janson Les, jugador profesional de Poker, declaró que había sido incapaz de descubrir debilidad alguna para explotarla, en la estrategia del bot.
- Sean Ruane.
- Michael Gagliano.
- Nick Petrangelo.
- Trevor Savage.
- Jake Toole.
- Linus Loeliger.
- Dong Kim.
- Anthony Gregg.
- Seth Davies.
- Jimmy Chou.
- Greg Merson
- Daniel McAulay.
Se realizaron dos pruebas, una con 5.000 manos contra los jugadores anteriores y otra con 10.000 manos contra trece jugadores profesionales de Poker. En ambas pruebas el bot siempre obtuvo mejores resultados que sus oponentes humanos, ganando un porcentaje más alto de manos y dinero. Los resultados han sido recientemente publicados en la revista Science. El proyecto fue financiado por Facebook a cuyo equipo de inteligencia artificial FAIR, (Facebook artificial intelligence research), pertenece Noam Brown.
En el siguiente video vemos al bot Pluribus jugar al Poker Texas Hold'em no limit en una mesa de seis jugadores, las cartas del bot, en la posición 4, han sido vueltas del revés para que podamos seguir la estrategia del software de inteligencia artificial.