Nash equilibrium in poker
Het Nash-evenwicht is de ruggengraat van Game Theory Optimal-poker. In evenwicht speelt elke speler een strategie waarbij niemand zijn resultaten kan verbeteren door eenzijdig te veranderen. Deze pagina legt uit wat een Nash-evenwicht in poker is, waarom het ertoe doet, hoe het zich verhoudt tot GTO, hoe bluff- en verdedigingsfrequenties ontstaan uit onverschilligheid, wat push/fold-evenwichten zijn, waar multiway-games het model breken en hoe je evenwichtsideeën aan de tafel gebruikt.
♠️ Definition: Nash Equilibrium
Een Nash-evenwicht is een set strategieën waarbij elke strategie een beste reactie is op de andere. In heads-up nulsom-pokermodellen is een evenwichtsprofiel niet te exploiteren. Als beide spelers evenwichtig spelen, kan geen van beiden de verwachte waarde verhogen door lijnen, betgroottes of frequenties te veranderen.
- Best response: De tegenstrategie die je verwachte waarde maximaliseert tegen een strategie van de tegenstander.
- Exploitability: Hoeveel een perfecte tegenstander per hand van jouw strategie zou kunnen winnen. Lager is beter. Nul exploitability is evenwicht.
- Mixed strategy: Randomiseren tussen acties met specifieke frequenties zodat tegenstanders onverschillig zijn en geen patroon kunnen exploiteren.
📚 Nash Equilibrium And GTO
GTO betekent Game Theory Optimal. In tweespeler-nulsommodellen van Texas Hold’em-subgames is een GTO-oplossing een Nash-evenwicht. Solvers benaderen evenwichten door strategieën iteratief te verbeteren totdat geen van beide kanten baat heeft bij afwijken. In multiway-pots is het spel geen nulsom en geven tools geen volledige tafel-evenwichten; oplossingen zijn lokale benaderingen gebaseerd op heads-up-abstracties en evenwichtsprincipes.
🧪 A Tiny River Toy Game
Modelleer een rivierspot met pot P en inzet B. De better heeft of value of een bluff. De verdediger kan callen of folden. In evenwicht gelden twee voorwaarden:
- Minimum defense frequency: MDF = P ÷ (P + B). Als de verdediger meer foldt dan 1 − MDF kan de better met willekeurige handen winstgevend bluffen.
- Bluff share for bettor: Met een gepolariseerde range is het optimale aandeel bluffs onder de bets B ÷ (P + B). Bluff-naar-valueverhouding is B ÷ P.
Deze formules komen voort uit onverschilligheid. De verdediger mixt call en fold zodat bluffs break-even zijn. De better mixt value en bluffs zodat een call voor de zwakste bluffcatchers break-even is.
🧱 Push Fold Nash Equilibria
Kortestack all-in-beslissingen preflop kunnen worden gemodelleerd als tweespelerspellen die Nash shove- en callranges opleveren. Deze charts gaan uit van heads-up-situaties, specifieke blind- en antestructuren en geen postflopspel. Ze zijn nuttige baselines voor toernooien en blind-versus-blind-scenario’s.
- Shove-ranges: Naarmate stacks krimpen, worden evenwichtsshoves breder omdat fold equity veel waard is.
- Call-ranges: Call tighter dan je denkt tegen optimale shoves. Te wijd callen is kostbaar omdat je equity pas realiseert nadat je je stack riskeert.
- Caveats: Antes, uitbetalingsdruk en tafelneigingen verschuiven beide ranges. Gebruik Nash als startpunt en pas exploitatief aan.
👥 Multiway Limitations
Full-ring cashgames en multiway-pots zijn geen nulsom tussen twee spelers en veel complexer. Eén statisch Nash-profiel voor alle spelers is niet wat praktische tools berekenen. In plaats daarvan gebruiken solvers paargewijze of heads-up-benaderingen en rangeconstructielogica die nog steeds gelden:
- Bluf minder naarmate het aantal spelers toeneemt, omdat benodigde folds stijgen en valuedichtheid toeneemt.
- Kies dikkere value en duidelijkere equity-semibluffs.
- Respecteer raises. Multiway-agressie helt in de meeste pools over naar sterkte.
🧮 Quick Equilibrium Math Reminders
- MDF = P ÷ (P + B)
- Benodigde caller-equity om te callen = B ÷ (P + B)
- Optimaal bluffaandeel onder bets op de river (gepolariseerd) = B ÷ (P + B)
- Optimale bluff-naar-valueverhouding op de river (gepolariseerd) = B ÷ P
Gebruik dit als baselines en pas aan op boardtextuur, ranges en tegenstander-tendensen.
📌 Nash Equilibrium Cheat Sheet
- Nash-evenwicht = niet te exploiteren spel in tweespeler-nulsommodellen.
- Onverschilligheid creëert MDF en bluffratio’s die direct aan betgrootte zijn gekoppeld.
- Push/fold-Nash is een kortestack heads-up-baseline. Pas aan voor antes, ICM en tendensen.
- Multiway is geen nulsom. Gebruik evenwichtsideeën maar bluf minder en ga dikker voor value.
- Train met evenwicht, speel exploitatief wanneer tegenstanders afwijken.
Het Nash-evenwicht geeft je de structuur. Jouw edge komt van herkennen wanneer echte tegenstanders daarvan afwijken en het kiezen van de beste reactie.