Bots Poker : Une menace pour le poker en ligne ?

Phil Laak
Phil Laak: notre dernier espoir humain?

La plupart des bons joueurs de poker, spécialement ceux jouant en ligne, ont connaissance de l'existence de « bots ». Bot est le diminutif de robot, et ceux qui nous intéressent ici sont ceux conçus pour jouer au poker.

Un bot est proprement une intelligence artificielle (IA), un logiciel sophistiqué programmé non seulement pour prendre les décisions optimales, mais aussi pour apprendre de ses expériences.

Il existe de nombreux robots bidons sur le marché, de vieux bouts de programme que vous pouvez acheter ou louer. Aucun ne joue au poker mieux que vous (enfin tout du moins je l'espère).

Cependant, il existe un bot de poker qui a réussi à acquérir une considérable renommée. Il s'agit d'une authentique IA, nommée Polaris, et développée par les membres du Computer Poker Research Groupe de l'Université d'Alberta.

Polaris a remporté de nombreuses confrontations contre d'autres bots de poker et a récemment connu le feu des projecteurs lorsqu'il domina un groupe de joueurs pros en ligne.

Vous pouvez visiter le site du CPRG et suivre l'un des liens, dont un qui vous permettra de jouer en heads-up contre Poki, un « bébé bot » dont le jeu est suffisamment bon pour être utilisé dans un programme d'entraînement au poker. Les autres liens vous dirigeront vers des comptes-rendus techniques et publications scientifiques.

Les bots en général, ceux de poker en particulier, et la notion globale d'IA, sont des sujets de fascination sans fin. Les « geeks » informatiques aiment les logiciels sophistiqués. Les mathématiciens se délectent dans la complexité des systèmes qui les sous-tendent.

Les scientifiques appliqués envisagent des extensions à des domaines à « information partielle » tels que les enchères, la négoce de marchandises et les échanges de devises.

Bien sûr les joueurs de poker les voient selon leurs perspectives à eux, depuis l'envie, la peur, jusqu'au dégoût associé à de grosses doses de paranoïa.

Le succès de Polaris semble également avoir fertilisé l'imagination des médias. Certains l'ont appelé le début de la fin du poker. D'autres ont associé Polaris à Deep Blue, l'ordinateur d'échecs à IA qui a battu Gary Kasparov.

D'autres encore ont averti du mauvais présage de savants fous aux bots clandestins se cachant sur Internet ne tenant aucun compte de simple mortels, des potins qui ont conduit les joueurs en ligne à de tendances paranoïaques. Il s'agit d'une affaire très provocante et nous devons comprendre ce qu'il se passe réellement.

Crevons l'abcès et voyons simplement quels sont les paramètres de jeu lorsqu'un humain se mesure à Polaris.

Quand le jeu est du...

Limit Hold'em (LHE)

Polaris ne s'assiéra pas (métaphoriquement parlant) dans une partie de Stud ou d'Omaha. Il joue seulement à un jeu. Dans les occasions où il fut programmé pour le No-Limit Hold'em, des adversaires humains talentueux l'ont constamment battu.

Le Limit Hold'em est bien sûr plus « algorithmique » que le No-Limit Hold'em. Cela ne veut pas pour autant dire que le LHE n'est pas un jeu complexe qui demande un haut degré de compétence ; il s'agit juste d'une reconnaissance du fait qu'il est simplement plus facile de développer des généralisations stratégiques effectives au Limit qu'au No-Limit.

Rien n'est également dit sur la possibilité de voir de futurs bots jouer un NLHE de niveau mondial, bien qu'il s'agisse d'une tâche d'une toute autre magnitude. Personne ne sait quelle est la stratégie optimale pour le NLHE, et celui qui le saurait n'est pas encore né.

Heads-up

Polaris joue seulement face à un adversaire. Le jeu en heads-up n'a qu'un nombre réduit de variables comparativement à une partie avec de multiples adversaires.

La charge de calcul d'un bot jouant face à plus d'un adversaire est dantesque, et pire, rien n'est moins sûr sur l'efficacité maximale des stratégies. Une nouvelle fois, il ne s'agit pas d'une discussion de principe face au développement d'un tel bot, mais plutôt de la prise de conscience des difficultés.

Duplicate poker

Les parties étaient jouées dans une version de poker basée sur le bridge « dupliqué ». Les mêmes cartes sont distribuées aux adversaires à différents moments, et chacun doit les jouer des deux côtés.

For exemple, une fois vous allez jouer A#Kdcontre le T 9 de votre adversaire. Et plus tard vous détiendrez T 9 contre le A K de votre adversaire.

Le jeu dupliqué réduit la variance en réduisant l'impact de la chance. Même si cela ne l'élimine bien sûr pas. Par exemple, vous pouvez (très justement) coucher une main avec laquelle quelqu'un suivra, et une river magique offrira à votre adversaire un pot que vous ne verrez jamais.

Néanmoins, à comparé d'une distribution aléatoire, le « duplicate » est connu pour réduire la variance de deux tiers. Cela augmente la puissances des statistiques tel que seulement 1/9ème de nombreuses mains sont nécessaires pour produire des résultats significatifs, ce pourquoi le CPRG l'utilise.

Certains voient le duplicate comme la solution du futur. Moi non. Parce qu'il réduit le paramètre chance, les joueurs les plus faibles auront moins de sessions gagnantes et perdront trop fréquemment. La balance entre la chance et le talent au poker tels qu'ils sont influents à l'heure actuelle convient selon moi pour dire qu'elle est parfaitement juste et équilibrée.

Les adversaires

Lors du match Pros contre Polaris, les "pros" étaient un groupe de jeunes joueurs expérimentés en ligne. Après 3000 mains, Polaris était devant de 195 petites mises, un résultat statistiquement significatif.

Lors d'une confrontation plus ancienne, Polaris affronta deux éminents professionnels, Phil Laak et Ali Eslami. Polaris battit Eslami mais Laak gagna suffisamment pour que les deux compères décrochent une courte victoire combinée. Notre race humaine (en admettant que Laak est l'un des nôtres) clama la victoire.

Les enjeux

Paramètre important mais mis de côté : Polaris ne jouait que pour du « cybercash », et non du vrai argent. Bien qu'il y ait un doute sur l'ego surdimensionné des pros (qu'est-ce qu'un top joueur sans ?), le fait que leurs bankrolls ne risquaient pas d'être atteintes a sûrement eu une influence.

Les cracks en ligne ont perdu un total combiné de 195 000 cyber-dollars. Auraient-ils joué différemment s'ils avaient été confrontés à la possibilité de perdre tant de « vrai » argent ? Quasi assurément. Auraient-ils mieux joué ? Peut-être. Pire ? Peut-être aussi.

Une plus sérieuse estimation

Au vu de tous ces facteurs, nombre de tenants sur le triomphe de Polaris ne semblent pas être garantis.
Les paranoïaques peuvent arrêter de maugréer à propos d'hackers pouvant voir leurs cartes cachées. Mais le succès de la CPRG est significatif et peut avoir des applications à la fois pour la science et le poker.

Pour l'un, il s'agit de l'avant-garde des programme à IA qui apprennent à partir du feedback d'un jeu très complexe. Et chose importante, cela montre que quelques heuristiques travaillent pour un jeu optimal en heads-up Limit Hold'em. Suffisant pour faire -beaucoup- réfléchir le joueur sérieux.

Il y aurait plus à dire, mais mes éditeurs deviennent nerveux lorsque je ne m'arrête plus, alors restons-en là.

La prochaine fois, j'examinerai un certain nombre de problèmes qui sont ressortis des blogs, sites web, ou autres médias, à propos des succès récents de Polaris.

Derniers Blog Posts »