纳什均衡是一组策略,使得每个策略都是对其他策略的最佳回应。在单挑零和的扑克模型中,处于均衡的策略组是不可被利用的(unexploitable)。若双方都用均衡策略,任何一方都无法通过改变线路、下注尺寸或频率来提升期望值。
- 最佳回应(Best response): 针对对手策略、让你期望值最大化的反制策略。
- 可被利用度(Exploitability): “完美对手”对你的策略每手牌可赢的量。越低越好;为零即为均衡。
- 混合策略(Mixed strategy): 按特定频率在多种行动间随机化,使对手对你的模式无从利用、保持无差异。