Vous voulez mieux jouer au poker et vous rapprocher du jeu d'un superordinateur ? Lisez ici les conseils de pros qui ont eux-mêmes affronté une machine.
Vous vous souvenez peut-être de Libratus qui a cette année battu une équipe de joueurs pros et réputés.
Même s'ils n'ont pas remporté le match, les joueurs ayant eu le privilège de se mesurer à cette intelligence artificielle sont en mesure de vous donner leurs conseils pour se rapprocher d'un jeu insondable et optimal, ou en tout cas celui pratiqué par une telle machine.
Attention, il s'agit ici de techniques avancées, et les débutants devraient d'abord commencer par les bases, pratiquer et gagner de l'expérience avant de se lancer dans ce genre de stratégies plus élaborées.
En guise d'introduction, vous pouvez lire cet article : Peut-on faire face aux superordinateurs ?
1- Ne vous ancrez pas sur la taille du pot pour la taille de vos mises
« L'Intelligence Artificielle a utilisé le "No-Limit" dans toute sa mesure » expliquait Dong Kim sur Twitter. « La plupart des joueurs ne vont pas à tapis trop souvent à moins que le pot soit gros, mais c'était justement la griffe de Libratus. »
Jason Les précise sur ce point :
« A la fois en No-Limit Hold'em et en Pot-Limit, vous remarquez à peine la différence après le flop. La plupart des gens ne misent pas plus que le pot. Quand ils le font c'est rare.
Lorsqu'ils jouent au NLHE, les joueurs semblent confinés à ne miser qu'un petit éventail de mises : le quart du pot, les trois-quarts, ... Libratus ne semble pas avoir ce problème. »
Quand on m'a appris à jouer au poker, mon coach me demandait toujours pourquoi je misais un certain montant. En tant que joueur loisir, sans avoir le temps d'étudier le jeu, j'ai toujours eu du mal à répondre à cette question.
L'une des choses qui agissait toujours comme une ancre pour moi, était la taille du pot. Et c'est quelque chose que j'ai appris en regardant des heures et des heures de vidéos d'entraînement de la part des meilleurs au monde.
Il y avait des schémas de mise distincts comme Jason les décrit, et les mises supérieures au pot étaient rares. C'est comme si le pot était une balise qui empêchait trop de mouvement.
« Les joueurs devraient être bien plus ouverts au fait d'utiliser des tailles de mise plus variées au-dessus du pot. » poursuit-il. « Le pot n'est pas une limite. C'est un point de référence. Je sais qu'il y a des joueurs qui overbet, mais la fréquence à laquelle les humains le font comparé à Libratus, est bien plus faible. »
J'ai demandé à Jason quels types de mains Libratus montrait après un gros overbet.
« Il l'a fait avec une large variété de mains. Vous auriez vu des trucs qui n'avaient aucun sens. Il faisait par exemple deux c-bet du pot avec la deuxième paire.
Dit comme ça ça semble ne pas avoir beaucoup de sens, mais faisant partie de sa stratégie générale, cela veut dire que lorsqu'il overbet le pot et que la turn paire la deuxième carte, il peut maintenant avoir un brelan parfois. »
2- Comprenez le pouvoir des "bloqueurs"
Un autre domaine où Kim et Les ont trouvé que Libratus excellait, est la conscience de l'effet des "bloqueurs", faisant partie de sa stratégie globale.
Comprendre l'effet des "bloqueurs" ou "cartes manquantes", c'est comprendre que les cartes que vous avez dans votre main réduisent la probabilité que votre adversaire ait les mêmes, ou qu'il puisse toucher ces cartes qui pourraient l'intéresser. En retour, cela affecte vos calculs pour définir les éventails de mains et votre stratégie de mise.
« La façon dont il créait ses éventails à prendre en compte selon ce paramètre le rendait très fort. Il était très conscient de comment ses cartes affectaient l'éventail de ses adversaires. »
Alors comment les humains peuvent-ils s'en servir ?
« Les humains peuvent s'améliorer en réfléchissant comment les cartes de leur main affectent ce que leur adversaire possède », répond Les. « Ils devraient y penser à la fois quand ils payent et quand ils misent : Est-ce que je bloque les bluffs, est-ce que je bloque ses folds ? »
3- Variez, variez, variez
L'écrasante différence entre l'IA et les humains, était la stratégie équilibrée de Libratus (équilibre est d'ailleurs l'origine de son nom). Il était ainsi incroyablement difficile pour les humains de définir un éventail de mains pour l'IA.
« Libratus répartit ses mains sur chaque type d'action » précise Jason. « C'est quelque chose que les humains ne peuvent pas aussi faire.
Le programme va en fait prendre la même main et un certain pourcentage de fois il va miser, parfois il va checker et suivre, et parfois il va checker et se coucher. Il n'est pas affecté par les bloqueurs ou ce qu'un adversaire peut avoir. C'est lissé en moyenne par rapport à toutes les possibilités, et cela donne beaucoup plus d'équilibre.
En moyenne les humains vont avoir un déséquilibre dans chaque direction. Dans certaines situations, ils bloquent beaucoup trop et n'ont pas assez de valorisation. Dans d'autres situations ils ne bloquent pas assez et vont trop pour la valeur. D'autres fois vous voyez des joueurs trop coucher ou ne pas miser assez. »
J'ai demandé à Jason comment un homme pourrait commencer à apprendre s'il avait une stratégie déséquilibrée.
« La seule façon pour pouvoir le faire, est de vous assoir et d'étudier en dehors des tables. Vous pouvez jeter un œil à la situation et vous demander - quelles sont toutes les mains avec lesquelles je miserais ici ? Combien sont des bluffs et combien sont des mises pour rentabiliser ?
Les joueurs réaliseraient et se diraient "mince, je ne bluffe pas tant que ça ici".
C'est un exercice qui prend du temps, mais quelque chose que vous avez besoin de faire encore et encore pour peaufiner votre stratégie et devenir un meilleur joueur de poker. »
4- N'ayez pas peur d'essayer de nouvelles choses
L'une des premières choses que Kim a remarqué était la façon dont Libratus a pu apprendre à jouer au poker. L'intelligence n'avait en effet jamais joué contre des humains avant le challenge. Elle a joué toute seule, et beaucoup - des milliards de mains.
Si les cracks du poker en ligne ont changé le visage du jeu lorsque ce poker online leur a permis de jouer plus de mains en un mois que Doyle Brunson aura pu le faire dans toute sa vie, alors imaginez les capacités d'un programme informatique conçu pour ne rien faire d'autre que jouer au poker.
« Libratus a appris et s'est coaché tout seul en jouant contre lui-même durant des milliards de mains. Là encore les humains ne peuvent pas faire ça » précise Jason Les. « Mais vous ne devriez pas avoir peur d'essayer de nouvelles choses et d'analyser objectivement ce qu'elles donnent.
Vous pouvez essayer de faire quelque chose, être malchanceux, perdre la main et abandonner. Mais vous ne devriez pas le faire ; vous devriez toujours être plus objectif. »
5- Recalibrez votre stratégie sur la turn et la river
Un autre domaine dans lequel Kim a remarqué que les humains pouvaient apprendre, était à propos du temps que Libratus prenait pour prendre ses décisions à partir de la turn. En discutant de ça avec Jason, il apparaît qu'il a été conçu comme ça.
Libratus pouvait évidemment prendre des décisions plus précises que les humains dans un laps de temps plus court, mais il ralentissait quand même à la turn parce qu'il était fait comme ça. Comme Jason l'explique :
« Quand Libratus arrivait à la turn il recalculait sa stratégie en utilisant quelque chose appelé le "End Game Solver". Je n'ai pas la compétence technique requise pour vous dire comment cela fonctionne, mais il recalculait donc sa stratégie à la turn pour jouer la turn et la river proche de la perfection à partir de ce stade.
Libratus s'arrêtait et réfléchissait pendant 30 ou 40 secondes sur ce qu'il allait faire à partir de la turn. Les humains aussi devraient penser à ce qu'ils font.
Après je ne veux pas que le poker devienne un jeu où tout le monde hésite 45 secondes à la turn ; je ne pourrais pas tenir un mois. Mais ne rentrez pas en mode pilote automatique non plus. Réfléchissez à ce que vous faites.
Peut-être que le milieu du coup, à la turn, c'est un bon moment pour réfléchir à ce qu'il s'est passé jusque là, et à ce que votre plan va être à partir de là. »