Quand un poker A.I. Est devenu fou avec cinq-trois adapté (Analyse)

Quand un poker A.I. Est devenu fou avec cinq-trois adapté (Analyse) | bluffer au poker en ligne

Les meilleurs Bonus de Paris du Moment










Dans partie 1 de cette série d'articles, nous avons parlé du fait que la grande majorité des joueurs de poker ne bluffent pas assez souvent.

En conséquence, leurs actions de pari représentent généralement «l'honnêteté» (mains de valeur) plutôt que la «malhonnêteté» (bluffs). Cela m'a amené à présenter ce que j'appelle le principe d'honnêteté.

Le principe d'honnêteté: Dans l'ensemble, la communauté de poker bluffe beaucoup moins qu'elle ne le devrait.

De l’autre côté du spectre, on trouve des intelligences artificielles comme Libratus, une création de l’Université Carnegie Mellon qui a récemment réussi à démolir certains des plus grands joueurs de No Limit au monde. Aujourd'hui, nous allons examiner une main folle que Libratus a jouée pour voir ce que nous pouvons apprendre de sa stratégie.

Bienvenue à la machine

La stratégie de Libratus était centrée sur la capacité de la machine à réduire l’écart entre les paris sur les valeurs et les bluffs, rendant très difficile pour les joueurs humains de deviner lequel était lequel. Le A.I. était beaucoup plus équilibré que les humains. Ainsi, il était assez difficile pour les humains de placer la machine sur une main.

Vous trouverez ci-dessous un exemple du degré de sophistication apporté par Libratus. Dans une interview avec Doug Polk, Daniel McAulay décrit une main folle qu'il a jouée contre l'ordinateur.

L'ordinateur avait 5 3 ♣ et Daniel a tenu X Y (Les cartes spécifiques de Daniel n’importent pas ici). Daniel relance en position, Libratus 3-bet, Daniel 4-bet, et finalement Libratus est appelé hors de position.

Déjà, nous voyons une pièce non intuitive de Libratus. La plupart des humains voudraient se coucher à chaque fois, ou même mettre un bluff à 5-bet. Un appel venant de hors de position semblerait être un jeu perdant à moins que le joueur qui le fait soit capable de faire des "méchants" paris dans le futur. Et Libratus capable était!

Le flop est venu K Q J. Libratus a vérifié et Daniel a vérifié avec son tirage couleur.

Tour était un tiers donner la couleur à Daniel. Libratus vérifie et Daniel vérifie à nouveau pour la tromperie.

La rivière était une brique (un peu comme le 5) et Libratus pariait avec son couple minable. Daniel a ressuscité petit pour faire croire à un bluff, et assez bien Libratus a tout mis en œuvre pour transformer sa dernière paire en bluff! Daniel a appelé, bien sûr, et a gagné la main.

Libratus perdre la main est à part le but, cependant. La ligne prise par l'ordinateur était une ligne de folie limite que presque aucun être humain n'est capable de prendre, en particulier un joueur gagnant qui sait qu'ils représentent une gamme très étroite, compte tenu de la manière passive avec laquelle ils ont joué le tournant et la rivière.

C'est exactement le point. Un joueur parfaitement équilibré peut et va apparaître avec n'importe quoi dans n'importe quelle situation et avec des fréquences optimales. S'il vous plaît noter que l'équilibre et l'optimalité sont les clés ici. Par exemple, les joueurs humains peuvent tenter de prendre des mesures qu’ils peuvent percevoir comme «aléatoires». En réalité, toutefois, ces actions sont généralement fortement biaisées. Notre espèce n'a pas encore trouvé le moyen de trouver la ligne de démarcation entre les deux.

Si la main ci-dessus vous semble un peu au-dessus de la tête, vous n'êtes pas seul. Les meilleurs professionnels qui ont affronté Libratus ont ressenti la même chose, et ils ont entre eux des millions (voire des dizaines de millions) d'expérience dans le poker. Je ne le présente ici que pour démontrer qu'il est impossible pour les humains de produire ce niveau de imprévisibilité parfaitement équilibrée; un mélange finement réglé qui empêche les adversaires de deviner, tout en faisant un profit dans le processus.

Nous devrions prendre un moment pour comprendre à quel point c'est difficile.

Par exemple, il serait très facile pour Bob de ne jamais bluffer, devenant ainsi totalement honnête et prévisible tout le temps. Il est également facile pour Bob de bluffer constamment, ce qui est imprévisible de manière prévisible, puisque désormais ses adversaires présumeront que ses paris sont plutôt faibles. Dans les deux cas, Alice, l’opposante de Bob, saurait à quoi s’attendre et elle peut donc ajuster sa stratégie en conséquence (tout simplement en se pliant beaucoup contre la première version et en luttant contre la seconde).

Ce qui est difficile, c’est que Bob trouve la limite entre bluffer et ne pas bluffer, de sorte qu’Alice n’a plus de décision claire. À part cela, il serait soit trop honnête, soit trop malhonnête, les deux pouvant être facilement exploités par un joueur très attentif comme Alice.

Bonne nouvelle, mauvaise nouvelle…

Ok, c’est une très mauvaise nouvelle pour Bob qui n’a ni le temps ni le désir de développer une stratégie gagnante aussi élaborée et compliquée. Qu'en est-il d'Alice? La stratégie optimale que Libratus semble se rapprocher alors sans effort ne semble pas facile du tout. Et ce n'est pas. Alors comment Alice a-t-elle pu le comprendre? Heureusement, elle n'a pas à le faire.

Alice ne joue pas au poker contre Libratus. Alice ne joue pas non plus au poker contre les meilleurs joueurs du monde. Alice joue au poker contre des gens comme Bob et parfois contre d'autres joueurs comme elle. Toutes ces personnes jouent selon le principe d'honnêteté, à quelques exceptions près, voire pas du tout.

Ce point même a été clairement expliqué dans une déclaration liminaire de Mason Malmuth et David Sklansky au début du livre de stratégie avancée de Mathew Janda, Applications du No Limit Hold’em. Le titre de leur déclaration était "Une mise en garde au sujet de Bluff-catching", et il s'agissait essentiellement d'un avertissement concernant les conséquences du non-respect du principe d'honnêteté lorsque vous tentez de miser de manière défensive sur de gros paris.

Ce que leur déclaration essayait d'accomplir était d'avertir les lecteurs que tenter de se protéger contre le bluff n'est pas nécessairement le choix le plus rentable. Cela est particulièrement vrai aux niveaux débutant et intermédiaire où la plupart des joueurs ne bluffent pas autant qu'ils le devraient.

Alice peut s’assurer que Bob reste honnête en l’appelant de temps en temps pour le tenir sur ses gardes. Mais si Bob bluffe déjà moins qu’il ne le devrait, chacun des appels d’Alice sera perdu à long terme. Ne pas l'appeler du tout lui serait plus profitable.

Bien sûr, en n’appelant jamais les gros paris de Bob, Alice s’ouvre au grand public. théorique possibilité que Bob pourrait théoriquement commence à en tirer parti en augmentant la fréquence de ses falaises. En tant que personne qui essaie de résoudre le jeu de manière optimale, c’est exactement ce que dit Janda. Si Alice cesse d'appeler, Bob pourrait théoriquement l'exploiter.

Bien sûr, le contrepoint de Malmuth et de Sklansky est que la plupart des Bobs ne sont pas assez bons pour le réaliser et qu’il est donc peu probable qu’ils s’ajustent. Je suis tout à fait d'accord. Bob n'est pas Libratus et dieu merci pour ça!

Autre exemple, Dan B. fait la même remarque dans son excellent article 3 appels théoriquement gagnants qui perdent en pratique. Dans ses mots:

Bien qu'un gros pli ne soit pas le jeu le plus sexy au poker, il est généralement le bon.

Paraphrasant Andrés «éducateur» Artinano (également présenté dans l'article):

… Ce sont les «dossiers» qui sont capables de monter en puissance.

Restez à l'affût de la troisième et dernière partie de cette série d'articles la semaine prochaine.

REMARQUE: Si vous voulez écraser votre jeu à domicile ou votre casino local, ne cherchez pas plus loin que le Plan de jeu postflop à 7 $. Ce cours accéléré vous enseignera un système éprouvé pour gagner au poker en moins d’une heure. En savoir plus maintenant!
bannière du plan de match postflop 2

Commentaires?

commentaires

Article sélectionné par sa qualité et traduit pour en faire profiter la communauté francophone – Nous ne sommes pas à l’origine de cet article qui est disponible sous sa forme originale iciSource ici

Les meilleurs Bonus de Paris du Moment