La IA vence a los humanos en Stratego

Un sistema de inteligencia artificial de la compañía británica DeepMind ha aprendido a engañar y derrotar a oponentes humanos en el juego de mesa Stratego, un juego con un número inimaginablemente alto de escenarios posibles.

Un sistema de inteligencia artificial (IA) cuenta con jugadores humanos expertos derrotado en el juego de mesa Stratego. Ese juego de mesa basado en la guerra tiene más escenarios de juego posibles que el ajedrez, el go o el póquer.

El sistema fue desarrollado por la empresa británica Mente profunda, convirtiéndose en uno de los jugadores en línea mejor clasificados de la versión de Napoleón de Stratego. Hizo esto, entre otras cosas, fanfarroneando con piezas más débiles y sacrificando piezas importantes cuando fue necesario.

LEA TAMBIÉN
Los niños silenciosos del Concorde

“Para nosotros, el comportamiento más sorprendente de la IA fue su capacidad de sacrificar piezas valiosas para obtener información sobre la alineación y la estrategia del oponente”, dice el investigador de DeepMind. Julien Pérolat.

10⁵³⁵ situaciones de juego

En Stratego, dos jugadores intentan apoderarse de la bandera del oponente, que se encuentra escondida entre las cuarenta piezas del juego. La mayoría de las piezas son militares, numeradas del uno al diez. Cuando dos soldados se encuentran en el tablero, el soldado de mayor rango vence al de menor rango (excepto el espía, que puede vencer al mariscal).

Mientras las piezas aún no se hayan encontrado, los jugadores no pueden ver la identidad de las piezas del oponente. Esto hace que Stratego sea diferente de juegos como chess and go, donde ambos jugadores pueden ver toda la información disponible desde el principio.

Lo que hace que Stratego sea aún más complicado es que hay hasta 10⁵³⁵ posibles situaciones de juego. A modo de comparación, go tiene 10³⁶⁰ posibles estados de juego, el ajedrez y el póquer tienen aún menos.

estrategia óptima

Perolat y sus colegas de DeepMind llamaron a su IA ProfundoNash. Aprendieron el sistema Stratego dejándolo jugar contra sí mismo 5.500 millones de veces. El tiempo de entrenamiento simulado correspondió aproximadamente a unos pocos siglos de juego de estrategia. La IA no tenía conocimiento alguno de las estrategias humanas existentes. Además, el sistema no fue entrenado para jugar contra oponentes específicos.

Se necesitaría demasiado tiempo de computación para pasar por todos los escenarios de juego posibles en el entrenamiento. En cambio, DeepNash tiene un algoritmo que dirige continuamente su comportamiento hacia una estrategia óptima basada en la teoría del juego, dice el investigador de DeepMind. Carlos Tuyls. Esa estrategia óptima garantiza al menos una victoria del 50 por ciento contra un oponente que juega impecablemente, incluso si ese oponente sabe exactamente lo que está haciendo la IA.

El resultado es una IA que puede tomar decisiones ganadoras a pesar de la información oculta sobre la posición de los oponentes, una gran cantidad de estados de juego posibles y muchas opciones posibles para cada turno. “Esto es algo que no podíamos hacer antes”, dice un investigador de IA julian togelius de la Universidad de Nueva York.

World Cup Stratego para computadoras

DeepNash ha derrotado a oponentes tanto humanos como controlados por computadora. En cincuenta juegos en una plataforma de juegos en línea contra jugadores humanos expertos, el sistema logró una tasa de victorias del 84 por ciento. Eso lo convirtió en uno de los tres mejores jugadores. Los oponentes humanos no sabían que estaban jugando contra una IA.

Además, la IA logró una tasa de victorias del 97 por ciento contra varios jugadores de la computadora. Entre ellos había varios que anteriormente habían ganado el Campeonato Mundial de Stratego para computadoras.

“Los buenos jugadores pueden recordar las piezas de sus oponentes y predecir en qué patrones se moverán”, dice georgios yannakakis, investigador de juegos de computadora en la Universidad de Malta. DeepNash hace ambas cosas bien, gracias en parte a una ventaja competitiva en memoria. Juega de formas interesantes e impredecibles, con elementos de farol”.

ttn-es-76

teknomers

Administrator

Visit Website View All Posts

Related Stories

Hellfest, Solidays, Eurockéennes… Cómo Free protegerá tu velocidad de Internet durante los festivales de este verano

De RTX Spark a la RTX 3060: Microsoft abre la IA local de Windows 11 a las GPU NVIDIA

¿Puede Google ser responsable de los errores de su IA en Search? El gigante toma una posición

You May Have Missed

Celtic: Martin O’Neill es la apuesta más segura mientras los campeones de la Premiership evitan arriesgarse

«Cuanto más gana el equipo de Francia, más se come»: la pizza, reina de las noches de fútbol.

«Llevarás su sueño contigo», la viuda de Diogo Jota escribe una carta conmovedora al escocés Andy Robertson antes de la Copa del Mundo.

“Iluminar todas las alcaldías en rojo”: el Día Mundial de los Donantes de Sangre, el 14 de junio, resalta la cadena de solidaridad y el acto generoso.

10535 situaciones de juego

estrategia óptima

World Cup Stratego para computadoras

About the Author

Related Stories

You May Have Missed

10⁵³⁵ situaciones de juego