Nash-likevekt i poker
Nash-likevekt er ryggraden i Game Theory Optimal (GTO) poker. Ved likevekt spiller hver spiller en strategi hvor ingen kan forbedre resultatet ved ensidig å endre seg. Denne siden forklarer hva en Nash-likevekt er i poker, hvorfor den betyr noe, forholdet til GTO, hvordan bløff- og forsvarsfrekvenser kommer fra indifferens, hva push/fold-likevekter er, hvor multiway-spill bryter modellen – og hvordan du bruker likevektsideer ved bordet.
♠️ Definisjon: Nash-likevekt
En Nash-likevekt er et sett strategier der hver strategi er beste respons til de andre. I heads-up nullsum-modeller av poker er en likevektsstrategi utnyttbarhetsfri. Hvis begge spiller likevekt, kan ingen øke forventet verdi ved å endre linjer, betstørrelser eller frekvenser.
- Beste respons: Motstrategien som maksimerer din forventede verdi mot en gitt motstanders strategi.
- Utnyttbarhet (exploitability): Hvor mye en perfekt motstander kunne vunnet per hånd mot strategien din. Lavere er bedre. Null utnyttbarhet = likevekt.
- Mikset strategi: Å randomisere mellom handlinger med bestemte frekvenser slik at motstanderen er indifferent og ikke kan utnytte et mønster.
📚 Nash-likevekt og GTO
GTO betyr Game Theory Optimal. I tospiller-nullsum-modeller av Texas Hold’em-delspill er en GTO-løsning en Nash-likevekt. Solvere beregner tilnærmede likevekter ved iterativt å forbedre strategier til ingen side tjener på å avvike. I multiway-potter er spillet ikke nullsum, og fullbord-likevekter er ikke det solverne leverer; løsninger er lokale tilnærminger basert på heads-up-abstraksjoner og likevektsprinsipper.
🧪 Et lite river-modellspill
Modellér en river-spot med pott P og innsats B. Betteren har enten value eller en bløff. Defenden kan calle eller folde. Ved likevekt gjelder to forhold:
- Minimumsforsvarsfrekvens: MDF = P ÷ (P + B). Hvis defender folder mer enn 1 − MDF, kan betteren bløffe hva som helst profitabelt.
- Bløffandel for betteren: Med polarisert range er optimal bløffandel blant bettene B ÷ (P + B). Bløff-til-value-ratio = B ÷ P.
Disse formlene kommer fra indifferens. Defenden mikser call/fold slik at bløffer går i null. Betteren mikser value/bløff slik at call går cirka i null for de svakeste bluff-catcherne.
🧱 Push/fold-Nash-likevekter
Kortstakkede preflop all-in-beslutninger kan modelleres som tospiller-spill som gir Nash shove- og call-ranger. Disse chartene antar heads-up-situasjoner, bestemte blind/ante-strukturer og ingen postflop-spill. De er nyttige baselines for turneringer og blind-versus-blind.
- Shove-ranger: Når stacker krymper, blir likevekts-shoves bredere fordi fold equity er verdifull.
- Call-ranger: Call tighter enn du tror mot optimale shoves. For brede calls er kostbart siden du realiserer equity først etter å ha risikert stacken.
- Forbehold: Anter, utbetalingspress (ICM) og bordtendenser flytter begge ranger. Bruk Nash som startpunkt og juster eksploitativt.
👥 Multiway-begrensninger
Fullring cash og multiway-potter er ikke nullsum mellom to spillere og langt mer komplekse. En enkelt statisk Nash-profil for alle spillere er ikke det praktiske verktøy leverer. I stedet brukes parvise/heads-up-tilnærminger og range-logikk som fortsatt gjelder:
- Bløff mindre jo flere spillere – påkrevde folds øker og value-tetthet stiger.
- Velg tykkere value og klarere equity-semi-bløffer.
- Respekter raises – multiway-aggressjon heller mot styrke i de fleste pools.
🧮 Raske likevektsformler
- MDF = P ÷ (P + B)
- Callerens nødvendig equity for call = B ÷ (P + B)
- Optimal bløffandel blant bets på river (polarisert) = B ÷ (P + B)
- Optimal bløff-til-value-ratio på river (polarisert) = B ÷ P
Bruk disse som baselines, og juster deretter for board-tekstur, ranger og motstandertendenser.
📌 Huskeliste: Nash-likevekt
- Nash-likevekt = utnyttbarhetsfritt spill i tospiller-nullsum-modeller.
- Indifferens skaper MDF og bløff-forhold som henger direkte sammen med betstørrelse.
- Push/fold-Nash er en kortstakk-heads-up-baseline. Juster for anter, ICM og tendenser.
- Multiway er ikke nullsum. Bruk likevektsideer, men bløff mindre og gå tykkere med value.
- Tren med likevekt – spill eksploitativt når motstandere avviker.
Nash-likevekt gir strukturen. Fordelen din kommer av å se når reelle motstandere avviker – og velge den beste responsen.