《The Mathematics of Poker》中文翻译

The Mathematics of Poker.jpg


既然曲线的峰值是曲线的最高点,并且在μ=‾x处取到峰值,那么这意味着‾x=1.15bb/100手就是分布均值的极大似然估计。这个也许看起来有些显然,但当我们添加了一些其他信息,并且从不同的角度来求这个问题的极大似然估计时,这个值并非总是等于样本均值的。

知道单独的赢率很可能给样本提供了样本均值这样一个有用的数据,但它对不确定性却没有很直接的帮助。不管怎么说,我们所观测的选手可能在这一阵很走运,也可能不走运。我们可以计算出16900手手牌数据的标准差,并借此对可能出现的赢率进行分析。

假设我们有一个样本N,其数据量为16900,并且其背后隐含的分布的均值(或者说赢率)是1.5bb/100手,并且其标准差为2.1bb/手,那么样本的标准差是:

blob.png 

这个数据总量的样本标准差比赢率要大。假设我们现在知道真实分布的各参数变量与我们观测到的相当。如果我们再取一个16900的样本,那么有32%的机率下这16900手样本的均值在小于-0.46bb/100手或者大于+2.76bb/100手。

这里产生了一些小问题。首先我们怎么可以确定我们观测到的样本的数据就反映了真实的总体分布呢?其次就算这些参数恰好就是真实总体分布的参数,你又怎么能确定另一个样本32%的情况下会偏离这个区间呢?而如果真实的赢率是其他值呢,比如说0?那么1.15恰好完美地落在了1个标准差的范围内。事实上,我们似乎并不能具体地说出均值为0与均值为1.15的样本的区别。

我们可以做的去应对这样的不确定性的事情是创造一个置信区间。为了创造一个置信区间,我们首先应该决定可以容忍的误差级别。因为当我们在处理一个统计过程时,我们不能简单地说总体均值是某个特定值的概率是0——有时我们会特别幸运或者特别不幸运。但是,我们可以选择一个叫做置信水平的值。这是一个代表了我们可以容忍的误差的概率。那么置信区间就可以帮助我们解决这样一个问题:“有哪些可能的总体均值取值使得观测值发生的概率比置信水平小?”


举报

+1

讨论区

0
noobsj

一直在追,翻译的很好,谢谢你的无私劳动分享

#1
2016-03-08 00:05
回复 举报

0
德州灰熊

有几个疑问,273/169,这里的169怎么来的? 32%,-0.46这几个数据怎么来的?

#2
2016-07-20 08:43
回复 举报

0
Lore  回复 德州灰熊

169就是16900/100呗。。。要算每百手的标准差,而32%1个标准差对应的置信区间,-0.46是1.15-1.61

#3
2016-07-20 20:17
回复 举报

0
爱唱歌的长颈鹿  回复 Lore

为什么每百手的使用16900的标准差除以169,而不是每手的标准差乘以10?

#4
2018-07-28 17:59
回复 举报

分享

关注扑克人微信公众号