世界杯火热开打,科研人员助力足球教练,数字应用成赛事新亮点

来源:

随着世界杯的开幕,研究人员正在利用他们的专业知识帮助足球教练训练球员和制定战术。

作者:大卫·亚当 (David Adam)

葡萄牙球员克里斯蒂亚诺·罗纳尔多上个月在曼联对阵纽卡斯尔的英超联赛第 72 分钟被替换下场,他看上去很不开心,这让他登上了国际头条。但许多球员都会有这种感觉,因为没有人希望被他们的教练替换下场。

今年在卡塔尔举行的世界杯上,球员将能够以更“有据可查”的方式向教练展示他们在球场上的价值。比赛结束后几分钟内,赛事组织者就会向每位球员发送一份详细的赛场表现分析报告。前锋可以看到自己跑动了多少次,被对方拦截了多少次。后卫可以看到自己在控球时干扰了对方多少次。

这是数字化在足球领域的最新应用。如今,数据分析可以指导球场内外的一切,从球员转会和训练强度,到制定有针对性的战术,以及提供球场上最佳的实时传球路线。

西甲球队分布状况_西甲各球队所在城市_西甲球队所在城市

比利时(红色球衣)在 2018 年世界杯四分之一决赛中击败巴西队。资料来源:TF-/Getty

与此同时,球员们面临着宇航员级别的数据审查。如今,可穿戴背心和腕带可以感知运动,使用 GPS 跟踪位置,并计算每只脚的投篮次数。从多个角度设置的摄像头阵列可以捕捉一切,从成功的空中对抗次数到球员控球时间。为了理解所有这些信息,大多数顶级球队都聘请了数据分析师,包括从微软和日内瓦郊外的欧洲粒子物理实验室 CERN 等计算巨头挖来的数学家、数据科学家和物理学家。

反过来,分析专家的见解正在改变足球比赛的方式。前锋现在选择远射的次数减少了,边锋更有可能选择传球给队友而不是传中,教练们更热衷于前场的高压防守——这些战术变化有确凿的证据来支持教练自己的直觉。

“大数据开启了足球的新纪元,”德国科隆体育学院的一位体育科学家说,“它改变了球队的战术思维、行为方式、分析对手的方式,以及培养人才和发现球员的方式。”

综合的

棒球是数据改变体育运动的一个著名例子。刘易斯 2003 年出版的《点球成金》一书详细介绍了奥克兰运动家队总经理比利·比恩如何在 2002 年利用球员数据和非常有限的预算组建了一支获胜的棒球队。比恩根据比赛表现的详细数据组建球员,包括之前未被注意到的指标,例如击球手上垒的频率。

比恩比那些从事足球运动的人更有优势。“足球比棒球复杂得多,”他说。棒球是一项回合制运动,只有进攻方才能得分。几十年来,棒球数据一直被广泛收集和研究。相比之下,足球是一项动态的、得分较低的“侵略性”运动(不断获得或失去领地),这使得记录球员行为及其对比赛结果的影响变得更加困难。几十年来,足球统计员一直专注于得分并试图建立模型来预测得分。

这种方法的变体至今仍用于预测比赛结果。牛津大学的一组流行病学家建立了一个数学模型,假设足球比赛的比分和失利分布在某个平均值附近。该模型准确预测了意大利队将在 2020 年欧洲杯上击败英格兰队,还正确预测了进入四分之一决赛的八支球队中的六支。[1]

这样的成功并非偶然,牛津大学博士生、2020年欧洲杯预测模型开发者佩恩表示,利用统计方法预测比赛结果的准确率超出了很多人的预期。

“首先,我们根据每场比赛中每支球队的总进球数和对手的相对实力,计算出每支球队的进攻和防守实力西甲球队所在城市,”他说。“一旦我们解出方程式得到这两个实力,我们就可以轻松预测每场比赛的结果。”对于卡塔尔世界杯,佩恩的模型表明,比利时(截至《自然》杂志发稿时,其赔率为 14/1)最有可能捧杯,其次是巴西(见下文“谁将赢得世界杯?”)。

完美表现

教练对场上事件的信息以及球员对他们的影响更感兴趣。

足球分析师长期以来一直在记录这些信息。其中最成功的一位是里普,他曾是皇家空军的会计师。20 世纪 50 年代,他花了很多时间观看英格兰足球比赛,观察球员位置和传球顺序等基本要素。里普甚至利用他的数据分析球队表现并提出战略和战术建议。他为狼队(俱乐部)带来了一种直截了当的打法,减少了横向传球,并帮助他们在五年内赢得了三次联赛冠军。

现代技术使收集和分析这些数据变得容易得多,因此大多数顶级俱乐部和许多国家队十多年来一直在聘请数据分析师。数据的使用深深植根于英国足球联赛体系。在攻读博士学位期间,佩恩还兼职担任牛津城足球俱乐部的数据分析师,该俱乐部是英格兰第六级国家联赛南部的半职业俱乐部。

许多分析师认为,伦敦布伦特福德足球俱乐部最近的成功部分归功于一种内部算法,该算法对各个联赛的球员进行评分,并帮助球队在转会市场上引进被低估的球星。利物浦足球俱乐部的数据团队包括曾在欧洲核子研究中心和剑桥大学工作的物理学家,他们专门建立了一个模型来评估球员在球场上的行为是否更有可能进球。里斯本大学的体育科学家与西班牙豪门巴塞罗那足球俱乐部合作,去年发表了一项分析报告,研究了球场上不同类型传球的机会窗口有多长[2]。

“我们(在牛津城)做的最有用的事情就是赛前报告,”佩恩说。“我们会查看对方球员的属性,并绘制一张图表来说明他们的比赛方式和移动方式。我会根据这个提出一些战术建议或改变。”在最近一场对阵牛津城宿敌的比赛前,佩恩发现对方左后卫的头球数据很差。他说:“所以我建议让高个子前锋打右路。”牛津城最终获胜。

这是经验丰富的球探可以亲眼看到的事情。但佩恩说:“数据比人更客观。”

俱乐部无需自己生成战术分析所需的原始数据,可以从商业公司购买。后者会对比赛视频进行转码,记录近 3,000 个场上重大事件,包括盘带、传球和抢断。最初,这种数据记录是手动完成的,但现在已被计算机视觉等人工智能 (AI) 技术取代。一般来说,数据会与汇总统计数据一起生成,例如每个球员的传球成功率。

电视摄像机报道了 2019 年女足世界杯上挪威队与英格兰队的比赛。图片来源:Ivill/FIFA/Getty

今年早些时候,英国华威大学数学本科生马克斯与宾大合作,为牛津城足球俱乐部开发了一个模型,该模型利用原始数据来评估牛津城联赛中所有球员的传球能力——这种详细分析通常在商业公司提供的原始数据中不会出现。

“你需要考虑他们如何传球,而不仅仅是传球成功率,因为​​有些传球比其他传球更难,”马克斯说。“这个模型可以帮助球队为比赛做准备。如果你知道对手在哪些方面传球更好,你就可以防守。”

拉维曾在微软担任数据分析师。2012 年,他转投当地的一家 MLS 俱乐部西雅图海湾人队,从事类似的工作。他的首要任务之一是利用 GPS 数据计算球员的跑步距离,以优化他们的训练和准备时间。“通过在训练期间收集这些信息,我们可以确定当天的训练量是过多还是过少,从而防止受伤。”

这种方法有效吗?“我们用这些方法打出了一些不错的赛季。但我不知道。因为避免的伤病数量是最难量化的。”

不确定性使人们对数据有助于实现体育卓越这一观点产生了怀疑,因为您无法进行受控实验来证明其有效性。不过,他说西雅图的教练对他的分析持开放态度,包括训练分析和评估球员能力评估。

“我可以和教练沟通,甚至可以直接和球员交谈,”他说。“这在其他俱乐部是不一样的。教练有时甚至不和数据分析师交谈。”

跑出镜头

分析人士现在越来越关注球员无球时的动作。

他说:“在足球分析中经常听到的一件事就是我们需要了解球员在没有球的情况下会做什么。”

这项任务更加困难和昂贵,因为它需要专门的摄像机,不仅要跟踪主要动作场景,还要跟踪不直接参与其中的球员西甲球队所在城市,每秒记录他们的位置约 25 次。他说,提供此类数据的公司通常会与国家联赛签署独家协议,这使得外界很难获取这些数据。

他说道:“如果我想招募一名南美或欧洲球员,我就无法了解他们的无球数据。”

近年来,出现了一种更强大的技术,它利用人工智能预测比赛镜头中的球员动作,即使是那些不在镜头范围内的动作。这意味着数据公司可以使用广播比赛镜头(不受版权限制)对全球球员在有球和无球时的动作进行全面分析。

谷歌的人工智能公司与利物浦足球俱乐部的数据团队合作开发了类似的预测模型[3]。

“通过这种应用,我们可以讨论战术或假设情景,”利物浦足球俱乐部研究主管伊恩说道,他放弃了剑桥大学高分子物理学博士后研究西甲球队所在城市,开始从事足球统计研究。

“对于比赛中的某个特定事件,该模型可以模拟数千种可能的情况。通过这种方式,你可以评估比赛中进攻组织的流畅性。”

动画展示了足球比赛中球员的实际移动(深蓝色代表进攻,深红色代表防守),以及模型对球员在镜头外移动位置的预测。灰色阴影区域是电视摄像机镜头(FOV)覆盖的区域,镜头跟随球(黑线)。该模型预测了 FOV 外进攻(绿色)和防守(橙色)的位置(两支球队的实际位置分别用浅蓝色和粉色表示)。来源:

利物浦不愿意发表这篇论文,因为俱乐部的数据团队不愿分享其工作细节或结果。但这是他们与该公司合作的条件。

“利物浦的分析部门是世界足坛规模最大、技术最先进的部门之一,但我们仍然缺乏独立建立这些模型的资源,”他说道,并向他保证其他俱乐部也做不到。

和其他数据分析师一样,他不愿承认自己对场上的胜利负有直接的功劳。“足球是一项充满变数的运动,所以球队经常会输掉不该输的比赛,也会赢得那些很难赢的比赛,”他说。“从很多方面来说,当球队表现不佳时,我们的工作会更轻松,因为我们的分析往往证明我们踢得很好。只要我们保持这种战术风格,球队本赛季就会赢得我们预期的那么多场比赛。”

加州大学伯克利分校计算机科学家卡尔·图伊尔斯表示,超越摄像头的建模是打造AI虚拟助理教练的第一步。该系统将利用实时数据指导足球等运动的决策。他说:“想象一下,AI观看比赛的上半场,然后在下半场对球队的阵型提出改变。”

图伊尔斯还表示,这种方法在体育之外也有用,比如模拟繁忙城市街道上自动驾驶汽车和行人的轨迹。

接下来是什么?像所有优秀的科学家一样,足球数据领域的专家强调,还有许多研究工作要做。前微软数据科学家萨拉·拉德 (Sarah Rudd) 在去年离开之前曾在阿森纳从事分析工作近十年,她羡慕赛车产生的大量遥测数据,这可以帮助车队改进和提高表现。

“我们一直在看一级方程式赛车,如果车队有这样的数据就太好了,”她说。“在足球界,仍有很多东西需要衡量,但我们还不知道如何分析它们。”

反映球员方向或重心变化的数据可能是足球数据分析发展的下一步。“轨迹数据的粒度可能仍然有点偏差,”拉德说。“不可能收集方向或重心突然变化的数据,因为这种变化会让防守队员失去平衡,或让守门员犹豫不决。”

即使是利物浦的人工智能分析模型也会因为对球员位置的不完全了解而感到困惑。“如果模型看到一名球员本应以这个位置首发,但却没有,它可能会认为他犯了一个大错误,”他说,“但也可能只是他绊倒了,躺在了草皮上。”

随着大量数据涌入现代体育场,它如何改变比赛?

他说:“我认为球员转会可能是受益最大的领域。”此外还有定位球战术,即球队获得任意球时使用的战术。

数据分析的一个明显教训是,球员不应该在离球门很远的地方射门。“如今,在世界各地的联赛中,球员的射门距离比 10 年前要近得多,”他说。“这是因为数据分析师开始问球员,‘你为什么要从那个位置射门?你的命中率只有 2%!’”

他补充说,现在许多球队也不鼓励球员尝试长传进入对方禁区,因为统计数据显示,这样的传球大多毫无意义。

随着生成的数据量不断增长,就业机会也将不断增加,他说,“我感觉如今体育界中数据无处不在,而且只会越来越多。”

参考:

1. Penn,MJ &, ONE17,(2022 年)。

2. Gómez-, LI, Amaro 和 Silva, R., Milho, J., Ric, A. & , P.Sci. 报告11,9792(2021年)。

3. ,S.et al.Sci.Rep.12, 8638 (2022)。

本文最初于 2022 年 11 月 15 日发表在《自然》杂志的新闻专题栏目上,标题为《世界杯:大数据是如何

©

doi:10.1038/-022-03698-1

标签: 世界杯 足球 预测 比利时 巴西