利用足球菠菜市场中的热手谬误
我之前为Pinnacle(平博)撰写的许多文章,以及我的书中的很多基础推理都将体育博彩视为难啃的骨头。
我曾经说过,至少那些流通性最高(投注量最大)市场(比如英超联赛)的赔率价格大体上反应了其关联结果的“真实”概率。换句话说,那些赔率非常高效地反映出两支足球球队的所有公开相关信息。一旦博彩公司采取行动,无论在哪支球队上投注的博彩玩家都难以找到盈利预期。
当然,博彩公司可能会在某些投注个例上犯错,但是从大量的比赛上看,因为市场随机收到足球球队的新闻,所以客户的投注结果也充满了偶然性。好运和坏运的影响在长期上都会被抵消,通常剩下的只有博彩公司的利润和大部分客户的损失。
有效市场假说出了什么问题?
最近几十年来,在某些程度上来说已经不再流行。现在,许多人认为人类的行为方式不会导向如此有效的定价,因为系统性(非随机)错误或偏误的表现会导致不完全理性的市场,其中就包括博彩市场。
一个普遍被引用的解释是我们无法正确地权衡大概率和小概率事件。具体根据观察所知,人们系统性地高估/低估不可能/可能事件的发生概率,并因此投注过多/过少的钱在冷门/热门上。这个从可能性/确定性效应衍生出来的偏误不出所料地被称为。数十年间,这个偏误已经渗透到了众多体育博彩市场。
热手谬误
对于概率的错误判断不是人们在博彩市场中表达偏见的唯一方式。人们可能会犯的另一个系统性偏误是热手谬误,有时也被称为逆赌徒谬误。
通过投注在相对“最冷”球队的Pinnacle(平博)收盘赔率上,确实还是有可能赚到利润。
错误出现的最初原因是人们严重低估了重复模式或连续胜利中的随机性。相反,人们更喜欢用因果性来解释连续胜利,倾向于认为连续胜利会继续发生。
阿莫斯·特沃斯基和他的同事在他们于1985年发表的论文中首先提出了热手谬误。在论文中,他们展示了人们觉得发生了手气超顺的连胜是因为对于机会的普遍误解。当人们相信这种谬误时,他们将忽略均值回归(在先前的极端数值之后的后续测量中,变量倾向于更靠近平均值)的影响。
这个原则并非是指事情必须回归平均(谬误的平均法则),而是事情倾向于回归平均(大数法则)。好运气之后常常会发生没那么好运的结果。对于坏运气来说也一样。“热点有冷下来的倾向”被“热点将在更长的时间内保持热度”取代。
热手谬误可能如何影响足球博彩市场?
当一支球队连续赢得比赛时,博彩玩家肯定会注意到这个情况。这会导致球队下次比赛时会有更多的钱投在他们身上,他们的赔率会低于如果没发生连胜时的赔率价值。
当然,球队连胜的部分原因可能是非常明确的,比如之前的胜利带来的利好因素。然而,如果博彩玩家忽视运气的影响并陷入热手谬误,那么他很可能高估连胜的明确原因。当机会占据主导位置时,接下来发生的情况还有可能会更快地朝着均值回归。
当一支热门球队处在连胜中时,他们比博彩玩家实际认为的更可能开始再次输掉比赛,这意味着他们的博彩赔率会低于公平赔率。冷门的、被忽略的、投注不足并因此赔率过高的球队则正好相反,他们更可能再次开始获胜,因此他们为博彩玩家提供了赢得预期价值的可能性。
衡量足球球队的“热度”
为了测试这个假设,我们需要找出衡量球队有多“热”或多“冷”的一些方法。使用投注赔率是其中一个方法。为了确保用来衡量的赔率尽可能地公平,我们首先必须移除博彩公司的博彩抽水。之前我曾详细地描述过移除抽水的(我在这篇文章中使用对数函数法)。
看来,我们有理由相信热手谬误导致了低效足球博彩市场。
“热度”能够使用考虑赔率以调整风险的方式进行衡量——获胜球队得到1 - 1/赔率的分数奖励,而输球的球队(或者平局中的两支球队)得到 - 1/赔率的分数奖励。
然后加上球队的连续比赛分数以得到累积分数。如果该计算中使用了正确的“公平”赔率,那么长期市场预期是球队得分为零。在投注方面,这等同于收支平衡。因此,短期上“热”(连胜)球队的分数为正数,而“冷”(连输)球队的分数为负数。
比如利物浦2016/17赛季的前六场比赛。下表中显示Pinnacle(平博)的收盘赔率、球队移除了抽水之后的假定“公平”赔率、比赛结果、球队在该比赛上赢得的分数以及他们的累积分数(之前所有连续比赛分数相加之和)。
衡量足球球队的“热度”
球队 |
对手 |
日期 |
收盘赔率 |
公平赔率 |
结果 |
得分 |
累积分数 |
利物浦 |
阿森纳 |
2016年8月14日 |
2.68 |
2.73 |
赢 |
0.634 |
0.634 |
利物浦 |
伯恩利 |
2016年8月20日 |
1.51 |
1.52 |
输 |
-0.656 |
-0.022 |
利物浦 |
托特纳姆 |
2016年8月27日 |
2.85 |
2.91 |
平局 |
-0.344 |
-0.366 |
利物浦 |
莱切斯特城 |
2016年9月10日 |
1.68 |
1.70 |
赢 |
0.412 |
0.046 |
利物浦 |
切尔西 |
2016年9月16日 |
3.52 |
3.60 |
赢 |
0.722 |
0.768 |
利物浦 |
赫尔城 |
2016年9月24日 |
1.25 |
1.26 |
赢 |
0.206 |
0.975 |
在六场比赛之后,利物浦比市场预期的“更热”。他们在第7场比赛客场作战斯旺西,斯旺西有着相对“更冷”的前六场比赛累积分数-0.468。
从利物浦的评分中扣掉斯旺西的评分之后,我们得到了+1.442的比赛评分,该数据可以用来测量利物浦比斯旺西“热”多少。我们也可以反过来使用-1.442的评分来评价这场比赛,这个相反的分数同样衡量了斯旺西的“热度”和利物浦相比如何。这样,每场比赛都可以用一对数值相反的评分来描述。
如果我们对于热手谬误的假设是正确的,那么比起支持相对“较热”的球队(正数评分),支持相对“较冷”的球队(负数评分)应该会赚到更多利润(或者至少没那么无利可图)。所以,在这个例子中我们应该考虑投注在斯旺西上,他们比利物浦相对“冷”1.442分。如果我们这么做了,就会输掉投注;利物浦以2比1赢得了比赛。不过只含有一个案例的样本不具有任何统计学意义。让我们来看看大量数据能否验证我们的假设。
测试热手假设
为了测试我们的热手假设,我回顾分析了九大欧洲联赛(可以说是流通性最好的足球博彩市场)过去五个赛季的足球比赛赔率数据(2012/13赛季至2016/17赛季):英超、英冠、英甲、英乙、苏格兰足球超级联赛、德甲、西甲、意甲和法甲,总共18,550场比赛和37,100个评分。
当一支热门球队处在连胜中时,他们比博彩玩家实际认为的更可能开始再次输掉比赛,这意味着他们的博彩赔率会低于公平赔率。
为了进一步优化我的方法,我只考虑了每支球队的最近六场比赛,以此计算球队的累积得分以及与对手相比的相对统治地位。这个选择是完全随意的。
我可以选择更多比赛或更少比赛,但是将最近表现作为值得分析元素的其他比赛评分系统常常使用最近六场比赛的数据。因此,每个赛季前六场比赛都没有比赛评分,剩下总共有15,820场比赛和31,640个评分。
在我计算出的所有31,640支主队和客队的“公平”赔率上投下调整了风险的本金(1/赔率)之后,总回报为100.35%,比起预期的收支平衡稍微好一点点。然而,如果将这些球队分为负数(“较冷”)和正数(“较热”)两组评分并投注,那么回报分别为101.84%和98.99%。
这两个数字看起来没有太大区别,但其中确实存在着微弱的统计显著性(p值为0.02,双样本单尾检验)。如下图所示,分别投注在相对“较冷”和“较热”球队上的五个赛季时间序列也许更具启发性。
31,640场比赛的评分介于±5.89。根据他们的“热度”强度,我将它们分成12个类别,每类都包含大致相似的数字。这些显示在下面的直方图中。评分“热度”和回报之间存在相当强的关系。球队和他们的对手相比“越冷”,从公平投注赔率上得到的回报就越高。
我还重新绘制了仅包括评分±1.50(10,574场或总样本的33%)的投注时间序列。这些“最冷”和“最热”评分的回报分别为104.83%和97.36%。这两个数据的差异具有更强烈的统计意义(P值为-0.001)
自然,博彩公司没有让客户在公平赔率上投注的习惯,尽管比较赔率能够找出接近甚至优于公平赔率的价格,但是大多数博彩公司的行为。尽管如此,正如下表所示,通过投注在相对“最冷”球队的Pinnacle(平博)收盘赔率上,确实还是有可能赚到利润。而且显然Pinnacle(平博)不会限制你这么做。
测试热手假设
- |
公平赔率 |
市场最佳赔率 |
Pinnacle(平博)收盘赔率 |
“冷” |
- |
- |
- |
所有负数评分 |
101.84% |
102.48% |
99.78% |
评分 < -1.5 |
104.83% |
105.69% |
102.71% |
“热” |
- |
- |
- |
所有正数评分 |
98.99% |
99.28% |
97.11% |
评分 > +1.5 |
97.36% |
97.49% |
95.52% |
超越热手谬误进行思考
虽然相关性从不代表着因果性(我们人类非常善于相信随机模式中存在着意义,特别是在寻找赚钱方法时),但是看来有理由相信热手谬误导致了低效的足球博彩市场。
看起来,博彩玩家在最近有连胜纪录的球队上进行了过度投注。因此,相对“较冷”的球队可能会为那些不随大流的人提供价值。自然,这个解释不应该被视为保证盈利的方法,它只是佐证了理解和从中产生的系统性偏误如何能被用于辨认优势。