moshman-collin-the-math-of-holdem.jpg


纳什均衡

  虽然石头剪刀布没有最好的玩法,但它存在一种GTO混合策略。在一种混合策略中,你做出的多个行动具有正向概率。这种GTO策略就是用1/3石头、1/3剪刀和1/3布来随机你的玩法。这种策略和所有策略打平,使它看起来是比其他优化策略更普通的策略。但是,任何其他策略都容易被压榨。这种纳什均衡策略是唯一保护你不受其他三种纯策略——总出石头、总出剪刀、总出布——伤害的策略。

 

在有现金奖励的石头剪刀布比赛中,你可以通过使用GTO玩法(虽然在现实游戏中的实践比较困难)确保即使最常在这种比赛中夺冠的人对你也没有任何优势。与之相比,这种比赛的赢家几乎肯定在使用可压榨的策略。他们认为自己可以通过使用不同的玩法赚到比使用GTO玩法更多的钱。例如,识别对手出招的模式,然后相应调整自己的下一次出招。

 

当两名玩家都使用1/3石头+1/3剪刀+1/3布的策略时,就成了一个纳什均衡的例子。

p69-1.jpg

如果你知道对手采用1/3策略(每种手势以1/3概率均等出现),你不能做出比自己也使用1/3策略更好的应对。如果你的对手偏离这种平衡的策略,那么你就有改变策略的动机。例如,如果他出石头比出布多,那么你就有不出剪刀的动机。如果你不知道对手的策略,你就可以通过使用纳什均衡策略保护自己不被压榨。

 

在包括德州扑克在内的任何两人对弈的定和游戏中,纳什均衡有一个唯一的期望值。每个玩家有一种确保对抗对手的任何策略都有不低于某个期望值的GTO策略。在德州扑克中,你应该思考这种纳什均衡可能是什么情况,以及你的玩法和对手的玩法如何脱离了纳什均衡。你应该知道你的玩法是否被某个遵循简单策略(比如说一有机会就诈唬)的对手压榨。

 

在多人游戏中,你可以找到一种导致任何玩家都没有改变动机的纳什均衡。但是,完美的玩法不再确保你在一种对称游戏(symmetric game)中至少平均而言不赚不亏。在多人游戏中,对手可能联合起来伤害你。

 

注意事项

注意,不要误解了对石头剪刀布游戏的研究。

 

在石头剪刀布游戏中,GTO策略和任何其他策略打平。即使是最易被压榨的策略,比如总是出石头,也和每种手势各以1/3概率出现的GTO混合策略打平。但不要把这个概念推衍到其他游戏中。在德州扑克这样的真实游戏中,GTO策略往往相对于糟糕的策略有着巨大优势。例如,你可能单方面犯错,低效地利用你的底牌,导致对手不需要调整就能打败你。一个最明显的例子就是放弃皇家同花顺。

 

不太明显的是,如果你30%的时候下注,但用错误的30%牌下注,那么你的对手不需要做什么事就能压榨你。如果你用错误的额度下注,你可能从你的好牌那儿只得到较少的价值,同时也不能高效地诈唬。

 

此外,虽然石头剪刀布游戏中的GTO策略是混合的,但在许多扑克场景中,因为隐藏的信息,GTO策略是非混合的。拿着某些牌,你可能总是下注;拿着另一些牌,你可能总是check。

 

有序石头剪刀布

  有序石头剪刀布与经典石头剪刀布相似,除了一名玩家首先行动。第二名玩家可以根据第一名玩家的行动而行动。

 

  如果玩家们意识到这种游戏的缺陷,他们就不会真正去玩这种游戏。第一名玩家有一种无法逆转的逆势。不管他怎么出招,第二名玩家每次都可以利用这个信息去选择正确的反制招数,因此使用混合策略并没有帮助。第一名玩家可以在石头、剪刀、布之间完美随机,但仍然会输。如果他分析游戏记录,他将看到第二名玩家1/3的时候出石头、1/3的时候出剪刀、1/3的时候出布,但总是正确的反制。

 

  在大多数扑克场景中,随后行动是一种优势。有序石头剪刀布有助于解释位置的强大。当你在对手之后行动时,你不必有一手强牌就能占据上风。

 

  我们已经通过分析一种简单游戏解释了混合策略、零和游戏以及GTO玩法,接下来我们将思考一种具有多重纳什均衡的游戏。


 推荐阅读:

l  德州扑克的数学-1:底池赔率

l  德州扑克的数学-2:期望值

l  德州扑克的数学-3:+EV的定义

l  德州扑克的数学-4:深度分析

l  更多连载……

 


举报

+1

讨论区

分享

关注扑克人微信公众号