Intéressant

Une IA développée par Facebook et Carnegie Mellon bat les champions du poker

Une IA développée par Facebook et Carnegie Mellon bat les champions du poker

Katy Lederer, auteur dePoker Face: une enfance parmi les joueurs, a dit un jour, "le péché cardinal au poker est de devenir émotionnellement impliqué."

Alors quoi de meilleur joueur qu'une intelligence artificielle non capable d'émotion réelle?

Un programme d'IA développé par l'Université Carnegie Mellon, en collaboration avec Facebook AI n'est que cela, et il a battu certains des meilleurs au monde au poker Texas Hold'em à six joueurs sans limite.

CONNEXES: DEEPMIND EST AUSSI MIEUX QUE NOUS DANS LES JEUX VIDÉO CO-OP FIRST PERSON SHOOTER

Rencontrez Pluribus

L'IA, appelée Pluribus, a battu Darren Elias, détenteur du record de la plupart des titres du World Poker Tour, et Chris "Jesus" Ferguson, vainqueur de six événements des World Series of Poker.

Chaque pro a joué séparément 5000 mains de poker contre cinq versions de Pluribus. Une autre expérience a vu Pluribus affronter 13 pros, qui ont tous gagné plus d'un million de dollars en jouant au poker.

Pluribus est également sorti victorieux après avoir joué contre cinq pros à la fois, totalisant 10 000 mains.

Performance surhumaine

Pluribus a été développé par Tuomas Sandholm, professeur d'informatique à Angel Jordan, et Noam Brown, qui termine actuellement son doctorat au département d'informatique de Carnegie Mellon en tant que chercheur scientifique à Facebook AI.

Dans un communiqué de presse, Sandholm a évoqué le jalon atteint avec cette nouvelle IA:

«Pluribus a réalisé des performances surhumaines au poker multi-joueurs, ce qui est une étape reconnue dans l'intelligence artificielle et dans la théorie des jeux ouverte depuis des décennies.

"Jusqu'à présent, les jalons de l'IA surhumaine dans le raisonnement stratégique se sont limités à une compétition à deux. La capacité de battre cinq autres joueurs dans un jeu aussi compliqué ouvre de nouvelles opportunités d'utiliser l'IA pour résoudre une grande variété de problèmes du monde réel."

Développer une IA remarquable

Pluribus a calculé sa stratégie «blueprint» en jouant six copies de lui-même. Un nouvel algorithme de recherche à anticipation limitée est la principale source de la capacité surhumaine de Pluribus à gagner au poker multi-joueurs.

L'IA a fait une utilisation remarquablement efficace du calcul. D'autres IA qui ont franchi des étapes importantes dans les jeux, comme DeepMind, ont généralement utilisé un grand nombre de serveurs et de fermes de GPU. Pluribus a calculé sa stratégie de plan directeur en huit jours en utilisant seulement 12 400 heures de base et seulement 28 cœurs pendant le jeu en direct.

"Nous sommes ravis de la performance de [Pluribus] et nous pensons que certaines de ses stratégies de jeu pourraient même changer la façon dont les pros jouent au jeu", a déclaré Noam Brown.

Un article de recherche décrivant la façon dont Pluribus a été fabriqué a été publié aujourd'hui par la revueScience.


Voir la vidéo: Grande Finale du Winamax Poker Tour avec YKLEE! (Octobre 2021).