​以下是本人关于GTO的一些思考和见解,固然可能有不足的地方,还请各位大佬评点指正。

首先我们要定义好GTO。我看过一些关于德扑GTO的资料,综合来讲我理解德扑中的GTO就是(简单地说)“不输不赢”。即不计抽水,当我们采取GTO策略时可以使得对手无论采取什么方式和打法,都无法从我们身上获得盈利,当然我们也无法盈利。也就是一个最佳防守策略。  我思考的就是这样的既定GTO策略是否存在于德扑?

GTO 最简单的应用例子是剪刀石头布,只要我们采取出剪刀、石头、布各3分之1概率的策略,不管对方采取出剪刀石头布什么样的概率策略,都是无法从我们身上获利的。这是GTO在博弈中的一个典型例子。这个GTO策略是既定的,即便我公开给对方看,对方确实就是无法采取任何策略获利。但现在我们看下另一个游戏:

一个智者跟你说:“我们玩个游戏,猜硬币正反面或猜1个骰子的点数。下注100元,你开一个赔率出来,然后我在两个游戏中选一个出来玩。最后我根据你开的赔率,我决定你来下注我来赔,还是我来下注你来陪。”请问你能制定一个GTO的赔率策略吗?

对于上面这个问题,显然我们不存在既定的GTO策略,因为不管我们开什么赔率,智者都可以通过选择游戏和谁来下注谁来赔使得自己获利。当然可能有聪明人会说:“当你选猜硬币正反面时,赔率1:1;猜骰子点数时赔率为1:5。”但因为这样的策略与智者的选择有关,这样的GTO策略含有主观因素变量,不属于既定的策略。既不存在一个既定的GTO策略(赔率)。

那么德扑的GTO到底属于以上哪一种?如果德扑的GTO策略只含有客观参量(如筹码总量,下注量,牌桌人数等),这就属于既定的GTO策略。但如果德扑的GTO策略含有主观因素变量(如对手fold 3-bet频率、咋呼频率等),那就说明德扑中不存在既定的GTO策略。 这两种GTO在德扑中最大的区别我认为是:如果第一种存在,那么理论上AI将能够彻底破解德扑,采用GTO 能够使我们面对任何对手都处于不败之地。这个游戏在某种意义上被打爆了。但如果是第二种,那么我认为德扑则有趣得多了。我们也就不能盲目自大地人为采取某种打法可使我们处于不败之地,永远都要去观察,去思考。

那么最后,德扑的GTO到底是哪一种?

我认为,是第二种,即不存在既定的GTO策略

为了简要说明,我这里举一个较简单的例子。Head-upsbbb都有2BB,开始时sb0.5BBbb1BB。问sb是否存在既定的GTO策略。

我们假设存在,那么根据既定GTO策略的特点,bb不管采用什么打法,sbbbEV都为0。我们设bb采取三种特别打法:1.all in any 2.fold any bet3.call any

sb最终的fold 率为Xcall 率为Yraiseall in)率为1-X-Y,牌的胜率为E。那么对于bb的三种打法,sbEV均为零,列出三条EV=0的方程,并可以得到两组解:

-0.5X+4E-2)(1-X=0

-0.5X+2E-1Y+1-X-Y=0

-0.5X+2E-1Y+4E-2)(1-X-Y=0

解得X=2/3Y=0E=0.75    X=0Y=1E=0.5

第一组解是不合理的,因为在fold2/3的范围剩下1/3的范围中,对any card的胜率E达不到0.75pokerstove显示只有约0.6,所以我们舍去第一组解。而第二组解说明了sb需要call any,则 any VS any 刚好胜率E=0.5,所以这是有意义的,我们取第二组解。

那么也就是说这里的GTO是且仅是sb call any。??是不是觉得有不对劲?没错!因为只对于bb采取的那三个特别打法,确实这是GTO ,但只要bb改变一下打法,sbcall any就马上死了!比如最简单的就是bb all in AAsb call any所以就call 了,这里明显bb就剥夺了sb的胜率,所以sb最终的EV是负的(反过来想,由于sb call any,所以当sb拿着AA的时候没有all in ,只是call,损失了价值)。

由此说明,sb不存在既定的GTO策略。也就是没有可以使自己对于bb的任何打法都处于不败之地的策略。相反的,sb需要了解bb的一些主观因素变量,才可能定出一套GTO的打法;当然,bb会因为sb这个打法而改变自己的策略,那么sb此时又要改变策略,二者应该在这种动态平衡中游戏。

希望通过此例以小见大,引出大家对德扑中的GTO的一些思考。我个人人为,德州扑克这个游戏的GTO应该是动态的(与主观因素变量有关)而不应该是既定的,这样才更符合德扑的本质,也让我们更热爱这个需要动脑、观察、思考的游戏。而不仅是一堆冷冰的数字。

评论 举报

5个回答
分享

1
me88uk
2018-08-07 14:58

玩具游戏试看


我觉得提问的人应该看看站长发在优酷上的这个视频

评论 举报 楼层地址


0
扑克小鱼
2018-08-03 23:50

你说的不是GTO,是剥削策略,一切“在对手x% PFR, x% VPIP, x% fold to 3bet etc”下的所谓均衡策略都是剥削策略,而GTO是不关注对手的倾向的……

评论 举报 楼层地址


0
n0th1ng
2018-08-03 17:55

别想这么复杂,简单点理解就是GTO打法是基于范围的,GTO策略的目标是实现整个范围的正EV。

评论 举报 楼层地址


0
城市疾走
2018-08-03 16:54

你应该没理解什么是GTO,GTO的本质是纳什均衡。GTO只是人们追求理论打法的极限,采取GTO打法是不可被剥削的(一定不会输,但是有可能赢,偏离GTO打法会被GTO打法剥削)。你先理解概念,你举得两个例子就很容易得到证明了

评论 举报 楼层地址


0
TJsuits
2018-08-03 10:24

​这些都是我自己思考的观点,实际上还没从数学上严格论证德扑中的GTO属于哪一种。但我认为对于某种既定的打法,都会有相应的应对策略。因此德扑的GTO也应该是动态的,而不是既定的。这样AI就不可能绝对地打败人类。

评论 举报 楼层地址


撰写答案

请登陆或注册后编写答案, 未登录时不会保存答案哦...


不知道答案? 你还可以 邀请回答
最近热门问题

关注扑克人微信公众号