职业牌手往往将他们的职业描述为“一种费力不赚钱的谋生手段”。他们最头痛的一个问题是——必须应对收入的不稳定性。
虽然使用了高效的技能组合,而且有多年的牌场经验,但许多牌手仍然回家时口袋中的钞票比上桌之前少。这种扑克中的资金起伏被牌手们一致称为“波动”(variance)。
在统计学术语中,波动被用来检测单一结果与一系列结果的平均值之间的差异。这种结果可以被描述成结果集中的数据点(data point),用来确定那个结果集的波动范围。
我们现在论证如何用小样本数据集来计算波动。假设你打算追踪之前在$3/$6级别限注德州扑克现金局(session)的战果,可能结果如下:
-11,+85,-30,+144,+9,+30,-87
其中每一个数字代表了七个数字组成的集合中的一个数据点。
七个session的总盈利是:+140(-11 + 85 – 30 + 144 + 9 + 30 – 87 = 140)
这七个session的平均盈利是+20(140/7)。
波动是平均值与每一个数据点的差值的平方。
对于第一个结果,波动是(20 – (-11))2 = (20 + 11)2 = 31.312 = 961
对于其他结果采用相同的运算过程可得出如下数字:
961,4225,2500,15376,121,100,11449
把这些数字加起来,再除以7,得出平均波动值:
961 + 4225 + 2500 + 15376 + 121 + 100 + 11449 = 34732
34732 / 7 = 4961.71
波动的另一个衡量标准,标准偏差(standard deviation)等于平均波动值的平方根:
SQRT(4961.71) = 70.43
大多数结果位于平均盈利值(+20)的标准偏差(+/-70)之内。根据这个结果,一名牌手预计打完一个session后结果应该在-50(20 – 70)到+90(20 + 70)这个范围之内。
但是,许多数据处在这个范围之外,这种结果究竟是运气差,发牌差,还是打得差呢?
样本数据包含的数据点越多,波动的测量值就越精确、越可靠。这个包含七个数据的数据集显然太小了,无法得出$3/$6级别限注德州扑克的精确波动估算值。而且,更多的数据点将给这名牌手关于控制不可避免的现金桌资金波动的更多信息。
波动与中心极限定理
另一个与样本大小有关的重要数学概念就是“中心极限定理“。这个概念告诉我们,随着一个数据集中数据点的增长,数据点的分布将类似于标准的统计分布(正态分布),如我们在典型的”钟型曲线“中看到的那样。
其指导思想是,样本数据越大,越多的数据点将落在(或接近)平均范围内。这种波动的测量标准将给予牌手对于他们预期结果的一个更准确的概念。