Les informaticiens de l’Université d’Alberta viennent de terminer un projet sur lequel ils travaillent depuis dix ans, pour mettre au point un programme qui puisse battre tous les joueurs de poker.
Appelé Cepheus, ce programme est censé jouer “parfaitement” les heads-up en Limit Hold’em.
Les médias ont bien sûr sauté sur l’occasion pour déclarer que le poker avait donc été “résolu” et qu’on venait donc d’entrer dans l’ère des machines.
Nous, joueurs de poker, sommes donc mal barrés, non ?
Pas tout à fait. Pas du tout, même.
par Dirk Oetzmann
Cepheus, kézako ?
Ce n’est pas la première fois qu’on essaye de créer un programme pour le poker à l’image des joueurs d’échec virtuels. Depuis que Gary Kasparov s’est incliné face à Deep Blue, on sait que les machines sont les meilleurs joueurs d’échecs.
On redoute ainsi depuis longtemps que le même phénomène se produise dans le poker. Ce cauchemar est-il finalement devenu réalité ?
Mike Howling et son équipe ont utilisé un programme capable de s’adapter, en théorie, à toutes les situations. Pour cela, ils ont enregistré toutes les situations pouvant se produire lors d’un heads-up, soit 316 000 000 000 000 000 (!), et ont fait jouer la machine contre elle-même.
L’objectif : arriver à “battre” le Limit Hold’em. Pour cela, 200 processeurs ont calculé sans arrêt pendant 70 jours et ont généré une base de données de 11 teraoctets… et ont résolu le poker !
Prenant d’abord des décisions totalement arbitraires, la machine s’est mise à jouer raisonnablement, puis parfaitement. Elle est même capable de bluffer.
Si elle arrive à imiter si bien le jeu humain, c’est qu’elle intègre un générateur aléatoire pour certaines situations.
Comme vous le savez, au poker il n’y a parfois pas une seule et unique bonne décision. La théorie veut que dans une situation particulière, il soit préférable par exemple de suivre à 70% et de se coucher à 30%.
Dans ce genre de situation, Cepheus ne prend pas de décision et s’en remet au générateur aléatoire, ce qui le rend aussi imprévisible qu’un joueur humain.
Evidemment, Cepheus ne gagne pas à tous les coups. Il est exposé aux mêmes bad beats que tous les autres joueurs. Cependant, sur le long terme personne ne devrait être capable de le battre.
Et personne ne le fera.
Cepheus, ses forces et ses faiblesses
Tout comme Deep Blue, Cepheus est bien supérieur aux humains en termes de calculs.
Les programmes informatiques peuvent traiter des milliers de situations en une fraction de seconde. Il n’y a qu’à voir le chiffre évoqué ci-dessus, on parle de quadrillions !
Cependant, c’est aussi ce qui fait la faiblesse du robot. Les humains peuvent rapidement éliminer la plupart des décisions parce qu’elles sont manifestement mauvaises.
C’est plus facile à voir aux échecs : vous n’envisageriez jamais de bouger votre roi tôt, à moins que cela ne soit absolument nécessaire. Le programme doit par contre forcément l’envisager avant de prendre une décision.
Et bien que Cepheus soit effectivement imbattable, il n’est cependant pas le meilleur joueur du monde. Cela vous semble paradoxal ? Et pourtant.
Comme le gourou du poker David Sklansky l’a déclaré récemment lors de l’inauguration de Cepheus : “Si le programme joue contre un mauvais joueur, il gagnera, mais pas aussi rapidement qu’un bon joueur humain le ferait.
Je peux aussi détruire un débutant beaucoup plus efficacement que ce programme informatique.”
En d’autres termes : c’est un avantage pour Cepheus d’être dénué de toute émotion et de ne pas risquer le tilt, mais il lui manque un instinct de tueur.
Et pourtant, si Sklansky jouait contre Cepheus, il perdrait. Même si cela prendrait sûrement longtemps.
D’ailleurs, si cela vous tente, vous pouvez tester le programme en ligne ici.
La fin du poker ?
Non. Et ce pour une raison très simple : même si un programme informatique peut mieux jouer qu’un humain, encore faut-il y être confronté.
Vous connaissez beaucoup de joueurs qui font des heads-up en Limit Hold’em ? Nous sommes allés vérifier pour vous chez PokerStars.com.
Il y avait 58 tables de heads-up de LHE à 1$/2$ ou plus. Sur 57 d’entre elles, un requin attendait patiemment sa proie. Une seule était active.
Par ailleurs, Cepheus ne sert plus à rien dès lors qu’il y a plus d’un autre joueur à table. Les interactions sont trop importantes.
Cepheus n’aura donc certainement pas un gros impact sur le poker.
Mais alors, à quoi sert-il ?
Ce qui est vraiment intéressant avec Cepheus, c’est qu’il est capable de battre n’importe quelle stratégie. Il n’essaye même pas de les identifier d’ailleurs, il s’en fiche.
Cepheus va être utilisé dans de nombreux domaines : médecine, sécurité, lutte contre le terrorisme.
Dans l’Alberta, les chercheurs sont déjà en train de travailler sur un programme qui permet de concevoir des plans personnalisés pour les personnes diabétiques. Cela peut paraître tiré par les cheveux, mais Cepheus leur sera très utile grâce à sa capacité à donner de bons conseils.
A l’Université de Californie, des scientifiques tentent de créer “un système qui permette de mobiliser des officiers sur les vols et des garde-côtes dans les ports".
Comme Cepheus qui est imbattable au poker, le projet de l’USC vise à créer un programme capable de générer des stratégies impossibles à exploiter pour les ennemis, explique The Independent.
Cepheus marque donc bel et bien une petite révolution en termes de programme de stratégie, mais il ne risque pas de détruire le poker.
-----
Le futur du Hold'em en suspens. Pour l'instant.
Cela fait très peu de temps que le Limit Hold’Em a été « résolu ».
26/05/15 - par Ken Lennaard
Certes, il ne s’agissait que de heads-up puisque la présence de plusieurs joueurs augmente la difficulté de manière exponentielle. Mais tout de même.
Il faut dire qu’il existe déjà des robots très compétitifs.
C’est peut-être une des raisons qui font que le Limit Hold'em s’est complètement éteint en ligne.
Des geeks au boulot, constamment
Le No-Limit, c’est une autre affaire. Le fait qu’il soit possible de modifier le montant des mises rend le jeu infiniment plus compliqué.
Mais évidemment, ce n’est qu’une question de temps d’ici à ce que les ordinateurs s’imposent enfin. Le pouvoir des chiffres et des mathématiques sera un jour en mesure de détourner toutes les tentatives de duperies humaines.
Des geeks travaillent constamment en créant des simulations de millions de mains. Et chaque fois qu’ils reprogramment leur machine, ils sont un peu plus proche du résultat.
J’ai beaucoup joué au backgammon. C’est un jeu qui a été assez facilement résolu. Malheureusement, ça en a retiré tout le plaisir : il n’y avait plus qu’un mauvais style de jeu et un bon, rien d’autre.
L’apprentissage est devenu extrêmement rapide puisque n’importe qui pouvait s’entraîner face au logiciel Snowie, qui joue parfaitement. À partir de là, le backgammon en ligne n’avait aucune chance de survivre.
Les échecs sont infiniment plus compliqués que le backgammon. J’y ai beaucoup joué aussi.
J’ai fait de la compétition pendant quelques années quand j’étais jeune, et déjà à l’époque tout le monde savait que les ordinateurs finiraient par battre le meilleur joueur du monde.
On peut débattre de quand c’est réellement arrivé. Je vous invite à suivre ce lien (en anglais) si le sujet vous intéresse.
Le jeu le plus dynamique
Au début des années 2000, beaucoup d’experts annonçaient fièrement que jamais un ordinateur ne pourrait battre un humain.
Ils n’étaient visiblement pas très bien informés, mais c’est une opinion assez raisonnable. (Sauf pour quelqu’un qui savait ce qui s’était passé aux échecs et au backgammon.)
Après tout, le poker est le jeu le plus dynamique jamais vu. Mathématiquement, le poker est bien plus compliqué que les échecs.
Ajoutez à cela l’aspect psychologique, l’endurance, les tells et la chance...
Les analystes académiques utilisent ce qu’on appelle la « représentation d’état », un outil permettant de déterminer toutes les positions possibles pour illustrer la complexité d’un jeu.
Voilà le niveau de complexité de différents jeux :
Morpion : 3
Limit Hold’em : 14
Dames : 20
Backgammon : 20
Echecs : 50
No-Limit Hold’em : 140
PokerSnowie m’a beaucoup impressionné
Je suis un bon joueur de Heads-up. J’ai battu trois champions du monde en heads-up.
Un de ces jours, je vous raconterai peut-être comment j’ai battu Greg Raymer, Chris Moneymaker et Joe Hachem en l’espace de six mois.
J’ai joué énormément de heads-up sur Internet aussi, parfois même contre Viktor Blom. Et je suis aussi persuadé d’avoir joué contre des robots.
Je dirais même que c’est arrivé souvent, même si j’ai beaucoup moins pratiqué que les spécialistes des heads-up en ligne.
Grâce à Internet, les gens apprennent très vite, et aujourd’hui je n’ai plus aucune chance face aux meilleurs joueurs.
Ils ont tous joué au moins un million de mains de plus que moi et on battu les meilleurs grinders pour arriver à ce niveau-là, donc l’inverse serait étrange.
J’ai relevé le défi PokerSnowie il y a deux ans et demi, pendant la Battle of Malta. C’était les débuts du logiciel.
J’étais le premier à jouer, et j’ai battu l’ordinateur. Le programmeur, un peu défait, m’a offert un t-shirt et un sourire, comme promis.
Mais le fait est que PokerSnowie m’avait impressionné déjà à l’époque, et je suis persuadé qu’aujourd’hui il n’y aurait plus photo entre nous si on jouait quelques milliers de mains.
Et il existe un ordinateur encore plus puissant.
L’ordinateur calcule toujours plus
Claudico a récemment remporté la compétition annuelle des ordinateurs de poker. Voilà ce que fait Claudico selon ses programmeurs :
« Claudico raisonne en temps réel pendant une main. Il fait évoluer sa stratégie pendant le match en calculant sans s’arrêter sur l’ordinateur Blacklight du Pittsburgh Supercomputing Center.
L’équipe de recherche a mis au point Claudico grâce à des algorithmes qui analysent les règles du poker pour établir une stratégie gagnante. Claudico n’est pas basé sur l’expérience de joueurs humains, sa stratégie n’a donc pas forcément grand chose à voir avec celles des professionnels chevronnés. »
Claudico vient de se confronter à quatre des tout meilleurs joueurs de heads-up du monde. Entre le 24 avril et le 8 mai, Claudico a joué 80 000 mains contre Doug Polk, Bjorn Li, Dong Kim et Jason Les.
Les parties ont eu lieu au Rivers Casino de Pittsburgh, où deux joueurs humains jouaient depuis le casino et deux autres depuis une salle privée en coulisse.
Les quatre étaient devant un ordinateur portable relié à un ordinateur principal coordonnant le tout.
Chaque jour, l’ordinateur tirait les mêmes mains face à deux des joueurs, et les mains de ces deux joueurs face aux deux autres, afin que cela soit aussi équitable que possible.
Autre règle particulière, les joueurs démarraient chaque main avec 200 BB. Tous jouaient 1500 mains par jour, entre 11 h et 22 h.
Les humains ont dominé l’ordinateur de plus de 73 327 grosses blindes, soit près d’une BB par main, et ont prouvé que l’ordinateur avait encore pas mal de calculs à faire avant de prendre sa revanche.
Nostalgie des années 90
D’après Doug Polk, l’ordinateur n’a pas encore le niveau des tout meilleurs.
S’il le dit, il doit avoir raison. Mais ce que je sais, c’est qu’un jour Claudico aura le niveau.
Probablement plus rapidement qu’on ne le croit (ou l’espère).
Alors le poker deviendra encore plus ennuyeux qu’il ne l’est déjà avec son armée de jeunes grinders aseptisés.
Ah, qu’est-ce que les années 90 me manquent, époque bénie où chaque joueur avait son propre style, où on se demandait si on pouvait jouer au poker sur Mac, et où le poker avait encore du charme et du caractère.
À propos de Ken Lennaárd :
Blogueur le plus contronversé de Suède, Ken Lennaárd écume le circuit professionnel du poker depuis près de 20 ans. Parmi ses nombreuses performances, on retrouve notamment des titres en live et en ligne lors du Championnat de Suède, trois tables finales aux WSOP, et plus de 1,5 million de dollars de gains en carrière. Désormais il apporte ponctuellement son ton et son impertinence à PokerListings.com.
dommage qu’on puisse pas mettre de capture d’écran en commentaire, je viens de tester la bestiole et après avoir jouer les 100 mains : moi 275, cepheus -275 ! voilà voilà….. un peu fish quand même le programme 🙂