AI 在改变足球吗?

近年来,致力于将人工智能应用于足球的公司如雨后春笋般出现,足球队也雇佣了分析师和数据科学家。本文就是探究背后的原因和展示应用数据对足球产生的结果。

运动存在了多久,博彩业也存在了多久。历史上古罗马人就在战车比赛中下注(据说奥古斯都皇帝在比赛中输掉了 30,000 塞斯特斯)。古罗马人为了赢得比赛,向神灵援引恩惠,而且用魔术师在铅板上写下魔法祈祷。

“我呼唤你,神灵,请求你折磨并杀死派系的马匹,并粉碎司机菲利克斯和迪奥克斯”——罗马人祈祷在游戏中获胜的铅板

如今人们已经不再依靠魔术师,虽然在2010年,还发生了依靠一只章鱼来预测世界杯结果的事。体育博彩业仅在 2021 年就产生了 43.3 亿的收入(并且还在增长)。对于博彩网站来说,估计赔率非常重要,这样可以避免用户的赢利出现损失。博彩机构使用复杂的算法来设定赔率。

预测胜负,不仅投注者感兴趣,机构也感兴趣。预测一个球队的胜利或失败的问题早就引起了数学家和统计学家的兴趣。Plos One 杂志上曾发表过一篇使用双泊松模型正确预测了四分之一决赛八个参赛者中的六个,以及意大利对英格兰的胜利的文章。

1982年提出的双泊松模型:即假设每支球队的进球数为泊松分布,其平均值取决于进攻和防守实力。

尽管已经有了很多更新的方法,但该方法仍然是预测足球比分的热门选择。用该方法赢得过皇家统计学会发起的预测比赛,表明即使这种简单的模型也能产生高质量的结果。

但这是一项追溯性研究。同一作者预测比利时将在2022 年杯赛中获胜。还有很多其他的预测,而且每一种都不一样。

经济学家劳埃德根据每个球员的可保值(累积值)预测英格兰将赢得杯赛(该方法在2014年和2018年起作用)。而 Opta 的分析师使用人工智能预测巴西将获胜(16.3%的赔率,阿根廷为13%)。Electronic Arts 用算法模拟了谁将赢得杯赛,押注了阿根廷。

2003年,《 MoneyBall 》一书曾轰动一时,讲述了比利-比恩(奥克兰运动家棒球队的经理)利用统计数据组建球队的过程。比恩证明,熟练地使用统计学使他比其他球探更好地识别球员。

把事实转化为数据。在数据中阅读出现实端倪,能发现别人看不到的一些球员的价值。有天赋的球员可能因为各种偏颇的原因和误认的缺陷被忽视。——节选自电影《 MoneyBall 》

有效识别人才不是一件小事:仅在2022年夏天,欧洲就花了44亿用于转会球员(今年最贵的是曼联的安东尼,8500万,但没有进入史上最贵的前10名)。除此之外还有很多花了几千万的球员,结果却没有为球队取得成功。

在篮球赛场上用数据分析球员是一种常态,但在足球比赛中这样做并不容易。在棒球中,统计数据也已经被收集和使用了多年,可能因为需要分析的因素较少(每次只有一支球队试图得分)。在足球中,许多模型只关注进球数或进球动作,但当时没有触球的球员也发挥着重要作用。

如今许多球队客服困难,不仅依靠观察员,还依靠专门从事算法的公司进行运营。许多人还聘请了分析师和数据科学家。

这其中最值得提起是 Brentford,它开发了自己的算法来选择那些价值较低但有高潜力的球员(目的以低预算购买他们,再以大收益率出售)。还有一位老板 Bentham 通过他的公司 Smartodds 赚取了数百万美元,因为他与一个统计学家团队一起比博彩公司更好地计算了比赛的结果。

“如果大卫想击败歌利亚,你不能通过使用相同的武器来做到这一点”—— Bretford 的联合董事

然而这不是一个找到最被低估的球员的问题,而是需要在成千上万的潜在候选人中找到最适合球队的球员。正如 Bretford 的老板所说,模型还必须关注球员的发展。

有一些公司完美地适合了这一过程中的不同角色。有的公司收集球员的数据,有的公司分析球员并提出潜在的购买建议,还有的公司提出适当的工资建议。例如,SciSports公司通过其算法跟踪 50 多万名球员,并向潜在的收购团队提供服务。

正如一些球队发现的那样,花费数十亿来获得最好的球员并不能确保胜利。足球是一个团队游戏,球员必须合作。目前一些研究人员和公司已经专注于如何改善球队的战略和战术。

事实上,这个想法并不新鲜。早在 1950年,查尔斯·里普就对比赛进行了分析,得出结论大多数进球都是通过少于三次的传球取得的,建议尽可能地把球往前传。多年来,更复杂的方法已经被开发出来,如里斯本大学与巴塞罗那合作开发的方法。研究员使用球员的位置数据来建立对对方防线的假设威胁。

一场比赛上半场的三幅热图,每幅10分钟,分别代表第5至15分钟(左图),25至35分钟(中图),以及35至45分钟(右图)。在这些热图中,暗红色的区域代表在30秒或更长时间内

当然,一场比赛中会有数百次传球。一支球队如果想分析战略以准备对抗另一支球队,就必须分析录像并计算统计数据。如今有专门的公司利用计算机视觉算法分析比赛录像,然后出售结果。

超神经上就有一个足球视频数据集,包含了来自 346 场高质量足球比赛的 171,191 个视频片段。该数据集可用于目标检测、动作识别、时间动作定位和精彩片段检测任务。

这些足球录像售价高昂。为了弥补这一缺陷,研究人员将重点放在预测球员不在画面中时的动作。最近 DeepMind 和利物浦俱乐部合作了一个类似的方法,并在最近发表了一篇论文(当然有 DeepMind 的创始人 David Hassabis 是利物浦的终身支持者的因素)。研究人员使用了组合统计学习、视频理解和游戏理论的方法。

足球尤其是人工智能研究一个实用的微观场景,以自动视频辅助教练(AVAC)系统的形式为体育界的决策者提供了长期的好处。

像足球这样的游戏是超级有趣的,因为有很多方出席,有竞争和协作的方面–DeepMind 研究员 Karl Tuyls

研究人员分析了欧洲球员的 12,000 多个点球,根据他们的射门方式和是否进球进行了分组。分析结果显示,中场球员使用了一种更平衡的方法:他们更有可能在左角射门,并使用他们最强的那个角度。

而且对门将来说扑救点球也有很多困难;他只有一瞬间的时间来决定是否扔出球和扔球的位置。不过现在守门员可以得到关于球员通常在哪里罚球的统计数据。也有专门针对任意球的研究,研究如何设置障碍物以使门将获得最佳视野。

其他研究的重点是分析球员何时该射门,何时该传球或保留,何时开始向球门跑等。其中一些研究使用的方法来自于自主机器的相同模拟算法。例如被阿森纳收购的 StatsDNA 就采用了这种方法(依靠遥测和基于马尔科夫链的算法)。

我不认为你会在未来六个月或一年内看到大的影响,但在未来五年内,一些工具会更加发达,你可以看到像自动视频助理教练这样的东西,它可以帮助进行赛前和赛后分析,或者可以看一场比赛的上半场,给你建议下半场可以做什么改变。 – DeepMind 研究员Karl Tuyls

表面上这些研究到目前为止还没有产生影响,只是停留在研究层面。但是近几年来,球员试图射门的距离已经减少。数据分析已经清楚地计算出了概率,距离增加得越多,得分的概率就越低。在数据和分析的支持下,球队推动球员从更近的距离射门,避免长传到对手的区域。

在比赛中决定是否替换球员也不是一个简单的选择(注意所有关于 C罗的替换争议)。“不存在偏袒,因为人工智能消除了决策中的情感”,马丁·麦卡锡说,他与 IBM 沃森合作进行赛前和赛后分析、换人选择和其他策略制定。

事实上,人工智能有望彻底改变足球周围的一切。有许多初创公司致力于研究球员的最佳饮食和训练。例如研究如何避免肌肉受伤,和在球员受伤的情况下,如何预测恢复时间或恢复的最佳策略的。

人工智能还有其他用途,用算法决定票价(根据比赛,最宝贵的时间和日期,等等)。在重大活动期间,进入体育场会产生排队和逃票,所以有公司研究将面部识别用于票务系统。德甲与 AWS 合作,以在转播时更好地选择观察点,制作亮点镜头,对球员做自动跟踪标记。

自主追踪机器人摄像机(特别是在COVID-19期间)已经被投入实验,虽然产生过失误,在一场比赛中算法误将一名边裁的光头认为是球。球迷们抱怨说,他们因此错过了自己球队的进球。

NBA 的一项研究表明,官方人员在 8.2% 的情况下会犯错,在比赛的最后几分钟有 1.49% 的决定是错误的(并且可能改变比赛结果)。

足球的情况也好不到哪里去,无休止的争议导致了VAR 和门线技术的引入。目前正在研究人工智能裁判,目的是避免有争议的案件(如马拉多纳在1986年世界杯上著名的手球la mano de Dios)。

体育新闻也可能发生变化。新的语言建模越来越能够生成连贯的文本。可能那些不经常报道的小联赛可以从中受益。荷兰当地媒体 NDC 已经在一年内使用算法编写了 60,000 场比赛的比赛报道。

足球联赛产生了大量的数据,从视频到成千上万的帖子、报纸文章和无尽的讨论。今天,许多球队在训练中使用传感器来够收集大量的数据。随着人工智能的发展,体育也会受到影响,这只是时间的问题。

但是体育界往往不愿意改变规则和引进技术,特别是在正式比赛中,如引进 VAR 和线路技术需要巨大的讨论)。

不过足球又是一个价值数十亿美元的生意,可以预见的是球队将开始依靠数据科学来改善签约。毕竟,在一个失败者身上花费一亿是一个代价高昂的错误。

整个复杂生态系统的其他方面也将受到影响,从战略到教练,从伤病预测到门票销售,甚至是体育新闻。

足球可以说是所有主要团队运动中最具挑战性的分析之一。它涉及大量角色各异的球员,很少有突出的事件,而且得分最少 – DeepMind 文章

与其他运动相比,足球带来了更大的挑战,而且还有其他外部因素需要考虑。假以时日,革命会必将到来。如根据算法,梅西这样的球员被认为是相对于他的价值过高,但他带来的广告回报是难以计算的。

与任意错误相关的争议都会产生大量的文章和评论,引发人们的兴趣。毕竟,这是一项全人类的运动,如果没有错误、争议和无休止的讨论,它的吸引力就会降低。

You May Also Like

More From Author

+ There are no comments

Add yours