当人工智能遇上世界杯靠谱的真不多
禹唐体育注:人工智能,无疑是当下的热门领域。在国内,将人工智能视为发展战略核心的企业也不在少数。以百度为例,从百度无人车“阿波龙”正式量产,百度自主研发的全功能云端AI芯片“昆仑”亮相,到百度大脑、智能语音操作系统DuerOS和阿波罗平台的3.0版本发布,以及智能小程序的上线,都表现出人工智能强劲的发展趋势。
而在体育界,人工智能同样大行其道。以此次世界杯为例,国内媒体在发布各自的世界杯报道与传播战略时,都会将人工智能作为一大亮点。理由并不难理解,毕竟这代表着一种黑科技,一种潮流,一种创新与突破。
值得一提的是,在人工智能与世界杯的结合方面,比分预测是最主流的一项。本届世界杯期间,无论是金融企业、博彩公司还是媒体平台,都利用自己的人工智能技术加入到了当年章鱼保罗的队列中,但与动物们依赖直觉不同,这些企业更希望依靠数据分析来预测未来。
作为全球历史最悠久,规模最庞大的投资银行之一,高盛集团表示本届世界杯,他们使用了最先进的统计方法仔细捕捉比赛的随机性,并在此过程中结合了大量信息与数据。
据了解,该人工智能运行了20万个模型来预测每场比赛的比分,在世界杯前,他们利用数据挖掘、机器学习和计量经济学对比赛结果进行了百万次模拟,从而预测出每轮比赛中的胜利者。
最终,高盛得出了这样的结论:法国、葡萄牙、德国和巴西将进入半决赛。德国与巴西分别击败葡萄牙与法国挺进决赛。在决赛中,巴西队将以1.70-1.41的比分击败卫冕冠军德国队,最终捧起大力神杯。
当然,最后的结果并不如高盛预测的那般。虽然法国与巴西还留在1/4的舞台上,但葡萄牙与德国却早已双双出局,其中德国更是小组赛没出线就惨遭淘汰。
除了高盛外,德国商业银行称经过数据建模工具上万次的随机模拟,德国队是本届世界杯的夺冠大热门,丹麦银行分析了“成千上万的数据模拟同时考虑经济学变量”,称德国会成为决赛球队的一支。而瑞银集团则在使用了“用以帮助客户挑选股票的计量经济学工具”后得到了“高度精准的模型”,认为德国队将再次捧起大力神杯。
与高盛一样,这些金融机构利用一系列数据模型模拟出来的比赛结果与实际进展并不一致。AI真的懂球吗?或许我们该打上一个大大的问号。
值得一提的是,据介绍,微软的人工智能和数据科学专家Sorin Peste通过结合泊松回归、排序算法以及随机森林等常用模型进行预测。他采用随机森林模型,在预测过程中建立很多决策树以独立预测世界杯每场比赛的结果。在让每一棵决策树独立生长后,最终将它们的判断进行整合,从而实现比分的预测。
然而需要指出的是,这些预测模型实际上都面临着一个本质性的困难——那就是缺乏真正有效的数据支撑,同时球赛的影响因素充满着不确定性,要想提前准确预测实在是困难重重。
众所周知,各国国家队之间的交手并不频繁,因此同职业联赛相比,国家队赛事往往无法从遥远的记忆中为近期比赛提供足够多的经验支持。以俄罗斯世界杯揭幕战东道主5比0击败沙特阿拉伯的比赛为例,两队上一次交手已经过去了整整25年之久。此外,根据俄罗斯在此前热身赛上的种种表现与阵容配置,人们很难想象他们可以取得这样的大胜,甚至淘汰西班牙这样的豪强。
此外,就像我们常常强调的那样,竞技体育的魅力就在于它的不确定性,这也造就了一个个传奇故事。冰岛逼平阿根廷,韩国爆冷击败德国,俄罗斯点球大战淘汰西班牙……从数据上来看,这些小概率事件恰恰构成了竞技体育与世界杯的魅力所在。
无论是选手的身体状态,精神品质,球队士气还是教练的排兵布阵,球员的临场发挥,亦或是裁判的争议吹罚,甚至家庭突发事件,能够影响胜负的要素实在太多。正是绿茵场内外种种纷繁复杂的要素造就了那句名言,“足球是圆的”。
另一方面,数据本身也具有一定的欺骗性,毕竟在统计时,一脚世界波进球和对方的乌龙球都会成为比分牌上的数字“1”,但这个数字却无法完全真实反映场上的情况。
例如,上一届世界杯德国送给了巴西一个耻辱的比分——7-1。如果抛开比分,从其他各项数据来看,这并不是一场一边倒的比赛——巴西射门18次,射正13次;德国射门14次,射正12次。从控球率来看,巴西也要超过德国4个百分点。
然而就像新浪体育在当时的报道中所说的那样,“只能说这是一场惊人的比赛,而数据有时候是骗人的……下半场开始时德国队已经‘收手’,而巴西依然在‘顽强抵抗’,一定程度上造成了这样的数据对比。”
结合以上种种,无论是高盛、微软还是博彩公司、媒体平台。至少从目前来看,要通过人工智能进行数据整合分析并成功预测球赛比分,仍不太现实。
不过,也幸好人工智能无法预测比赛,要不然这个世界的无趣或许会再添一分。