2018年俄罗斯世界杯正在火热进行中,随着各路豪强纷纷登场,比赛的气氛也逐渐达到高潮。如果说足球比赛是一道大菜,那赛前的预测就像开胃小菜,世界杯如果缺少了各方预测,比赛氛围也会寡淡许多。在足球预测圈,球王贝利、“章鱼哥”保罗与“乌贼刘”刘语熙堪称预言三剑客,给人留下深刻印象。
随着科技进步,人工智能正越来越多地被用在比赛结果预测上,不仅是结果,球队组成、战术选择和球员训练都已经开始见到机器学习的身影。对于球迷和观众而言,人工智能也将展开一种全新的参与体育赛事的体验。
高盛机器学习预测巴西夺冠
肯尼亚的投资银行Genghis Capital Investment Bank的投资银行分析师Gerald Muriuki,日前在Medium上公布了他使用机器学习预测FIFA 2018的结果——巴西将赢得冠军。
高盛的人工智能算法吸收了各个球队的球员特点、个人数据和最近的表现,利用4个机器学习模型将这些数据与2005年以来的世界杯和欧洲杯比赛得分进行对比。
然后,他们还对世界杯进行了100万次模拟,最终预测了比赛结果。公众号后台回复:“高盛”,获取本文预测报告。
当然,不可能把所有可能产生影响的变量都计算在内——这一点已经在2014年明确体现出来。高盛当时预计巴西将会最终夺冠,还有一些预测给出了不同结果,但却没有几个预测到巴西在半决赛中惨败德国。
这是他的模型预测最初几场比赛的结果:俄罗斯vs沙特,俄罗斯胜利;乌拉圭vs埃及,乌拉圭胜利;伊朗vs摩洛哥,平局。
16强的结果是这样的:
四分之一决赛将在葡萄牙vs巴西,以及德国vs阿根廷之间展开。
最终巴西vs德国,巴西获胜。
“我们使用尖端方法认真考虑了比赛的随机性,并考虑了很多信息。”高盛在今年的预测报告中说,“但预测仍然存在极高的不确定性,即便使用最先进的统计技术也不例外,因为足球是无法预测的比赛。当然,这也正是世界杯的魅力所在。” 高盛在之前几届世界杯中都做过预测,结果却不尽人意,这一次他能否一雪前耻?7月15日一起见证。
人工智能:Python实现(影印版)
作者:普拉提克`乔希
当当
广告
购买
微软专家预测巴西获胜,阿根廷第二
高盛的预测结果跟微软的AI和数据科学专家Sorin Peste的预测结果一致。微软的AI和数据科学专家Sorin Peste的预测过程则更加完善。在数据的选择上,除了历年世界杯结果,Peste还使用了欧洲杯、奥运会等大型比赛的数据,以及这些比赛的胜率分布。
此外,Peste还考虑了比赛的地址,也即是在主场、客场还是在双方都无关的中立场所,以及比赛是否“friendly”,在踢friendly比赛时,目的不是为了赢球,而是为了观察对手的球员和策略。
在模型的选择上,Peste用的是随机森林(深度500),一种根据呈现给它的特征生成多个决策树的算法,并且每个单独的树对每个新输入向量的结果“投票”。随机森林的速度快,相当准确,可以对泛化误差进行无偏估计,因此不需要交叉验证。
下图展示了迭代1000次后的结果,巴西获胜,阿根廷第二。
实际上,预测世界杯冠军是一个典型的机器学习问题,你首先预测每场比赛的获胜者,接着再预测小组赛、半决赛和决赛的冠军。在这个过程中,你需要进行数据整合、特征建模和结果预测。因此,很多机器学习或数据科学家,都做过类似的项目。
Muriuki和Peste两个人都是根据足球比赛的历史数据,建立机器学习模型,模拟比赛,并预测这些比赛的结果。
俄罗斯大学生预测德国夺冠
日前,俄罗斯彼尔姆国立研究大学宣布,该校学生制造出的人工智能预测本届世界杯的冠军是德国队。
该预测系统是该校物理系大四学生维克·扎科派洛多搭建的神经网络。扎科派洛根据 2006 年、2010 年和 2014 年的比赛数据,提炼分析出了几条对结果影响最重要的因素,然后将数据输入网络,来预测本次世界杯的结果。
也就是说,AI 甚至不认为俄罗斯队能够在小组赛中出线。作为一款俄罗斯AI,可以说是相当耿直了。
KDnuggets大数据预测德国夺冠
当然,除了机器学习,还有更多预测是使用大数据方法。KDnuggets上一位狂热球迷用统计的方法,预测德国队会夺冠。他的操作步骤如下:
收集信息:
国际足联世界排名:这是所有211支国家足球队的排名系统。使用积分系统,积分是基于所有FIFA认可的国际比赛的结果。然而,这并不是最好的系统,而且有很多缺点。
Elo评级:该系统最初是为国际象棋联合会FIDE开发的,目的是给棋手打分。它的复杂矩阵根据比赛的类型分配点数,并考虑到双方的净胜球差异。它和国际足联的主要不同之处在于,它也统计了友谊赛的数量。
TransferMarkt team value:这个总部位于德国的网站提供了关于足球各个方面的信息,包括每个知名球员的估计市值。他们列出了参与国的名单和他们的团队价值。
投注赔率:使用投注比较网站OddsChecker,采用每个国家最慷慨的赔率。
TransferMarkt的数字是欧元,而FIFA和Elo有他们自己的评级系统,投注赔率是分数。作者将每一个系统都标准化,使它们具有可比性。在统计中,标准分数(也称为z分数/值,正常分数或标准化值)是数值与平均值不同的标准偏差数。
2018年世界杯,四个流行的预测来源
KDnuggets预测的z分数
如果KDnuggets的预测是正确的,那么世界杯小组赛的结果会是下面这样的:
研究结果引出了一些有趣的结论: