पोकर में नैश संतुलन
Nash equilibrium, Game Theory Optimal (GTO) पोकर की रीढ़ है। इक्विलिब्रियम पर हर खिलाड़ी ऐसी रणनीति खेलता है जहाँ कोई भी अकेले बदलकर बेहतर परिणाम नहीं पा सकता। यह पेज बताता है कि पोकर में Nash equilibrium क्या है, यह क्यों महत्वपूर्ण है, GTO से इसका संबंध, उदासीनता (indifference) से ब्लफ़ और डिफ़ेंस फ़्रीक्वेंसी कैसे निकलती हैं, push–fold इक्विलिब्रिया क्या होते हैं, मल्टीवे खेल इस मॉडल को कहाँ तोड़ते हैं, और टेबल पर इक्विलिब्रियम के विचारों का उपयोग कैसे करें।
♠️ परिभाषा: Nash Equilibrium
Nash equilibrium रणनीतियों का ऐसा सेट है जहाँ हर रणनीति दूसरों की सर्वोत्तम प्रतिक्रिया (best response) होती है। हेड्स-अप, शून्य–योग (zero sum) पोकर मॉडलों में इक्विलिब्रियम रणनीति प्रोफ़ाइल अनएक्स्प्लॉइटेबल होती है। यदि दोनों खिलाड़ी इक्विलिब्रियम खेलें, तो कोई भी लाइनों, बेट साइजों या फ़्रीक्वेंसी बदलकर अपना EV नहीं बढ़ा सकता।
- Best response: प्रतिद्वंद्वी की दी गई रणनीति के विरुद्ध आपका अपेक्षित मूल्य अधिकतम करने वाली काउंटर–रणनीति।
- Exploitability (शोषणीयता): आपका प्रतिद्वंद्वी आपकी रणनीति के ख़िलाफ़ प्रति हाथ सैद्धांतिक रूप से कितना जीत सकता है। जितना कम, उतना बेहतर। शून्य शोषणीयता = इक्विलिब्रियम।
- Mixed strategy (मिश्रित रणनीति): निश्चित फ़्रीक्वेंसी के साथ अलग-अलग क्रियाओं के बीच रैंडमाइज़ करना ताकि प्रतिद्वंद्वी उदासीन रहे और किसी पैटर्न का शोषण न कर सके।
📚 Nash Equilibrium और GTO
GTO का अर्थ है Game Theory Optimal। टेक्सास होल्ड'एम के दो-खिलाड़ी, शून्य–योग सबगेम्स में GTO समाधान ही Nash equilibrium होता है। सॉल्वर रणनीतियों को क्रमिक रूप से सुधारते हैं जब तक कि कोई पक्ष विचलित होकर लाभ न कमा सके-अर्थात एक निकट-इक्विलिब्रियम। मल्टीवे पॉट्स में खेल शून्य–योग नहीं रहता और पूरे टेबल का इक्विलिब्रियम वही नहीं है जो सॉल्वर निकालते हैं, इसलिए समाधान हेड्स-अप अमूर्तताओं और इक्विलिब्रियम सिद्धांतों पर आधारित स्थानीय अनुप्रयोग होते हैं।
🧪 एक छोटा रिवर टॉय-गेम
रिवर पर पॉट P और बेटर का साइज B मानें। बेटर के पास या तो वैल्यू है या ब्लफ़। डिफ़ेंडर कॉल या फोल्ड कर सकता है। इक्विलिब्रियम पर दो शर्तें होती हैं:
- Minimum defense frequency (MDF): MDF = P ÷ (P + B). यदि डिफ़ेंडर 1 − MDF से अधिक फोल्ड करता है तो बेटर किसी भी दो कार्ड से लाभ के साथ ब्लफ़ कर सकता है।
- बेटर का ब्लफ़-शेयर: पोलराइज़्ड रेंज के साथ बेट्स में ब्लफ़ का इष्टतम अंश = B ÷ (P + B). ब्लफ़-टू-वैल्यू अनुपात = B ÷ P.
ये सूत्र उदासीनता से आते हैं-डिफ़ेंडर कॉल/फोल्ड ऐसे मिलाता है कि ब्लफ़ ब्रेक-ईवन रहें; बेटर वैल्यू/ब्लफ़ ऐसे मिलाता है कि सबसे कमज़ोर ब्लफ़-कैचर के लिए कॉल ब्रेक-ईवन रहे।
🧱 Push–Fold Nash Equilibria
शॉर्ट-स्टैक प्रीफ्लॉप ऑल-इन निर्णय दो-खिलाड़ी खेलों की तरह मॉडल होकर Nash शव और कॉल रेंज देते हैं। ये चार्ट हेड्स-अप स्थिति, विशेष ब्लाइंड/एंटे संरचनाएँ और पोस्टफ्लॉप खेल न होने को मानते हैं। टूनामेंट्स और ब्लाइंड-वर्सस-ब्लाइंड में ये उपयोगी बेसलाइन हैं।
- Shove रेंज: स्टैक्स घटने पर इक्विलिब्रियम शव रेंज चौड़ी होती है क्योंकि फोल्ड इक्विटी का मूल्य बढ़ जाता है।
- Call रेंज: इष्टतम शव्स के विरुद्ध आपकी सोच से टाइट कॉल करें। बहुत चौड़ा कॉल महँगा है-आप पूरी स्टैक रिस्क करने के बाद ही इक्विटी रियलाइज़ करते हैं।
- चेतावनी: एंटे, पayout-प्रेशर (ICM) और टेबल प्रवृत्तियाँ दोनों रेंज बदलती हैं-Nash को शुरुआत मानें और एक्स्प्लॉइटिव रूप से समायोजित करें।
👥 मल्टीवे सीमाएँ
फुल-रिंग कैश गेम्स और मल्टीवे पॉट्स दो खिलाड़ियों के बीच शून्य–योग नहीं हैं और बहुत अधिक जटिल हैं। सभी खिलाड़ियों के लिए एक स्थिर Nash प्रोफ़ाइल वही नहीं है जो व्यावहारिक टूल्स निकालते हैं। इसके बजाय, सॉल्वर युग्म (pairwise) या हेड्स-अप अनुमान और रेंज-निर्माण तर्क उपयोग करते हैं जो फिर भी लागू होते हैं:
- खिलाड़ियों की संख्या बढ़ने पर ब्लफ़ कम करें क्योंकि आवश्यक फोल्ड्स बढ़ते हैं और वैल्यू-घनत्व बढ़ता है।
- मोटी वैल्यू और अधिक स्पष्ट इक्विटी वाले सेमी-ब्लफ़ चुनें।
- रेज़ का सम्मान करें-अधिकांश पूल्स में मल्टीवे आक्रामकता स्ट्रेंथ की ओर झुकी होती है।
🧮 इक्विलिब्रियम गणित: त्वरित रिमाइंडर
- MDF = P ÷ (P + B)
- कॉल करने के लिए कॉलर की आवश्यक इक्विटी = B ÷ (P + B)
- रिवर (पोलराइज़्ड) पर बेट्स में इष्टतम ब्लफ़-शेयर = B ÷ (P + B)
- रिवर (पोलराइज़्ड) पर इष्टतम ब्लफ़:वैल्यू अनुपात = B ÷ P
इन्हें बेसलाइन मानें, फिर बोर्ड-टेक्सचर, रेंज और प्रतिद्वंद्वी प्रवृत्तियों के अनुसार समायोजित करें।
📌 Nash Equilibrium चीट शीट
- दो-खिलाड़ी शून्य–योग मॉडलों में Nash equilibrium = अनएक्स्प्लॉइटेबल प्ले।
- उदासीनता MDF और ब्लफ़-अनुपात देती है जो सीधे बेट साइज से बँधे हैं।
- Push–fold Nash शॉर्ट-स्टैक हेड्स-अप बेसलाइन है-एंटे, ICM और प्रवृत्तियों के लिए समायोजित करें।
- मल्टीवे शून्य–योग नहीं-इक्विलिब्रियम विचार लें पर ब्लफ़ घटाएँ और वैल्यू मोटी रखें।
- इक्विलिब्रियम के साथ ट्रेन करें, खेल में प्रतिद्वंद्वी–विचलन पर एक्स्प्लॉइट करें।
Nash equilibrium आपको ढाँचा देता है। बढ़त तब आती है जब आप देखें कि वास्तविक प्रतिद्वंद्वी इससे कब भटकते हैं और आप सर्वोत्तम प्रतिक्रिया चुनें।