科学松鼠会» 如果让科学家来选“国脚”

文/金煜

和篮球、棒球等相比,进球少的足球向来以难以量化出名,主观因素即让球场上变得风云莫测,但又同时给预测和评选等相应措施带来很大的不便。不过,且慢,谁说足球不能量化的?

美国学者阿马罗(Luis Amaral)不仅看球、踢球,还将自己的数学能力运用到足球中去,利用数学模型设计出一种“量化{zj0}球员”的计算方式。其结果基本符合欧洲杯的评价结果,现在世界杯正热火举行中时,他的“{zj0}球员”模式也正一路测试过来。

统计难度
集体运动更难量化

足球是世界上{zlx}的运动,但也是最难量化的运动。足球球场变化复杂,球的运动轨迹无从预测。相比之下,为得分较多的篮球和棒球比赛做数据统计就容易多了,你甚至可以计算出每个球员对整场球赛的贡献是多少。但是,足球更多是一门集体活动,每一粒进球都是集体合作的结果。12个人的合作到底是如何导致更好的进球表现的,这在数学上的解释依然相当之少。而对于全体队员来说,个人的表现到底该如何评判也很模糊。

“要量化足球是很困难的,很多表现只能凭借主观来评判。”前国安队总经理、北体大成教学院院长马冰说,“队员状态如何,传球、进攻、防守表现如何,都得靠人为判断。一般评选{zj0}球员都只能人为判断。”

不过,美国西北大学的化学生物工程教授,同时也是该校复杂系统中心成员的阿马罗和他一帮热爱足球的科学家朋友却不相信这点。“要测量一名球员的球场表现,必须‘隐藏’在球队中才能进行:不管是从对方球队得球,还是传球给队员,个体球员都可能对全队造成极大的影响。”他们在6月16日发表于开放在线期刊《PLoS》上的研究中写道。

阿马罗在接受本报记者电话采访时说,从小就看球的他一直以来都对足球有一个困惑:“看球的时候,总有喜欢的球队和球员,因此在做评价的时候不免会有偏好。我们就想怎么可以客观地评价足球队和队员。”

量化球员表现并非{dy}次。“这些排行榜的问题是,并未与公认的其他评价标准进行验证。”

这份研究名为《量化球赛中个体球员表现》,阿马罗与合作者们以2008年欧洲杯为对象,分别对所有球员的表现进行了量化,评选“{zj0}球员”。其结果与体育媒体、球队专家、教练、俱乐部经理等普遍认可的主观评价一致。

主要指标
传球是核心数据

和对篮球的研究不同,他们的量化指标并非立足于进球数。事实上,现在的足球比赛中也会统计一些基本数据,比如射门次数、任意球数、助攻数等,而阿马罗小组的研究则侧重于传球的次数。

阿马罗介绍说,研究者将一支球队视为一个计算机“网络”,球员之间的传球就是这个网络各节点之间的连接。当然,因为比赛的目标就是进球,因此,是否进球也成为被列入评价指数之一。“我们看球从最初开始运动到{zh1}完成射门这一路的过程。”阿马罗说,“以射门结束的球的运动路线越多,球队表现就{zj0};同时,以射门结束的球在某个队员中经过的越多,这名队员的表现也{zj0}。”

研究者们用数学模型绘制出了“网络”中各球员之间的球的流动,再加上射门的数据,形成{zh1}的结果。模型只计算射门成功的传球,丢球、射失等都不计分,球每过一名球员(节点),这名球员就会得到1分。然后,数学模型会模拟运行几百万次,看网络中队员{zh1}的平均得分是多少,高于平均值越多的球员,表现就越佳。

比如,在2008年欧洲杯德国对西班牙一战中,德国队后卫之间的“节点连接”非常多,但在中场和前锋之前却并不活跃;相反,西班牙队全场的连接都非常活跃。计算结果显示,西班牙队表现更佳,其最终以1比0胜德国。

数模的结果与欧洲杯的评价一致,西班牙得分{zg},评分体系中得分{zg}的20名球员同样也是公认的欧洲杯前20名{zj0}球员。西班牙8号中场哈维在一场比赛中的得分{zg},他的后卫队员拉莫斯则在所有比赛中的得分{zg}。“如果我们的测量方式不好的话,不可能结果和这么多专家的评估有如此惊人的一致。”他说。

阿马罗说,这个评分系统可以用在历史上的一些{zj0}球员的评价中,比如,足球历史上最xx的争论:真正的球王是谁,贝利,还是马拉多纳?

{zx1}数据
梅西暂列{zj0}

这种计算方法是否会突出中场和前锋,而忽视以破坏对方进攻为主的后卫?阿马罗解释说,后卫可以降低对方球员的得分,此外,往往射门得分的连续传球都是从后卫开始的,后卫可以从对方脚下抢走球,发动新一轮的进攻,也可以通过很好的传球给中场和前锋创造机会。“你看我们对本届世界杯已进行的比赛的分析,得分高的常是后卫。”阿马罗说。

本届世界杯成为这个小组测试这个系统的{zj0}对象,它们对每场球赛都进行分析,并在实验室的主页上更新公布每场球赛,每个球队,每个球员的表现评估。到截稿前,阿根廷球员梅西得分{zg}。

那么,守门员怎么办?阿马罗表示,守门员是现在这个计算中{wy}没法准确评估的球员,“守门员的角色跟别的球员都不一样。”

这个系统在欧洲杯的评估表现得很好,但以个人突破见长的南美球队是否会不适应这个系统?对此,阿马罗说,“巴西队也有很多传球,球队风格并不影响算法。并不是说这个系统更适合某支队伍。事实上,到目前为止,等级{zg}的是南美球队,韩国队也有很好的得分。”

即使如此,在现阶段,通过这个系统来预测谁最终会夺得大力神杯还有很多的不确定性。“世界杯到现在这个阶段,一个问题是,运气的成分还是很大。”他解释道,“比如西班牙和瑞士的比赛,西班牙踢得很好,有很多机会可以攻门,但都运气不好没攻入。美国队和英国的比赛也是这样。运气起到了很大的作用。”

“足球比赛就是这样,即使很努力,但还是不一定会赢,不确定性就是足球的{zd0}魅力。”他说。不过,随着更多的比赛出现,好队好的表现会越来越出现好的结果,到淘汰赛的时候,可能就可以对表现优秀的球队做出预测了。

另类统计
如何让你的球队获胜?

希腊亚里士多德大学的研究者们也对世界杯的比赛进行了一系列统计研究。这些数据或许值得各队的主教练们好好研究。他们发现,下半场比上半场更容易进球。在 1998年和2002年世界杯中,大部分进球都是在下半场完成。2006年世界杯中,其差距减少,但下半场的进球依然以52.5%的比例居多。研究者分析说,比赛进行越长,进球也越多,他们猜测,原因可能与队员疲劳、缺水、注意力分散导致防守失误,以及战术策略有关。研究者还对欧洲杯的进球模式进行了分析,发现44%的进球都来自有组织进攻,35.6%来自定位球,20.3%来自防守反击,在进球前的运球方式中,长传占了最多,达34.1%。在定位球中,进球最多的是角球和任意球。

提供了相关比赛的数据统计结果。这是世界杯赛事发文前的球员TOP20。

  1. Sheldon 说:

    梅洛排名好高啊!

    • 说:

      可惜巴西还是杯具了……

  2. 说:

    这个算法有问题,阿根廷和西班牙都喜欢倒球,推进速度慢,但会进一些所谓的团队进球,就是传二三十脚得分的场面,那样队员得分自然就高。象德国队员靠跑位技术和稳定的传接技术,几次传递就能到门前,这样的球队得分就低。前二十一个德国球员也没有,说明算法取样太单一。

    • Zis76_2mm 说:

      xx赞同你的意见,应该在每次取样中加入时间因素的考虑,每次成功进球所需时间短者加分。
      德国战车隆隆向前!!!

    • 说:

      呵呵,照他们这个算法,我估计最厉害的球队是90年代初的哥伦比亚队,球员是巴尔德拉马。他们好多传球都在一米以内。

    • 理科太次郎 说:

      我一直梦想建立一个合适的球队量化模型,掌握这种赌球利器就发大财啦\(^o^)/~
      量化足球的难点在于概率因素、球员水平、团队配合、球队战术四者的平衡
      本文重点在球员水平和团队配合上,但是单单以传球衡量球员和团队水平实在太狭隘,例如加图索、普约尔这样的防守球员还有范尼、维埃里这样的强力中锋,当然因扎吉这样的机会主义者让他多传球也不太现实,所以对于不同位置上的球员指标应该有相应的权重变化
      另一方面,既然是拿来“选”球员就必须考虑战术安排,斯内德、罗本在皇马不得志显然不是因为球员水平问题,所以只用传球一项数据来衡量很可能选错人或者漏选
      当然,数学家的笔头子永远也赶不上贝利的”上帝之嘴“,从这种意义上说,贝利是{jd1}的“球王”,拥有“上帝之手”的马拉多纳也只能甘拜下风了

  3. changst 说:

    关于进球,从发动进攻开始,到临门一脚,中间传递不超过5次的进球概率有没统计,恐怕要在除去定位球中占到8成以上

    基本上频繁倒脚阵地进攻是没啥效果的

  4. 说:

    踢足球不是一个人在战斗撒!

  5. timelau 说:

    赞同火柴说的,这个研究考虑的因素太少了。

  6. 叮当 说:

    我是很喜欢这样的基本统计方法,我感觉这样的统计适合于强队对弱队的比赛,甚至实力很接近球队之间的比赛。
    这个方法也有比较突出的弱点,正如这位科学家所说,“运气”。他既没有定义“运气”也没有说那些是什么和“运气”有关,使得他的整个数模丢分不少。
    有足球经验的人都知道,找出攻防平衡的某个“点”是很重要的。通常对胜负起作用的是那个“点”开始,场的控球传球统计。对于一个球队来说,攻和防是相反的函数状态,用到进攻的资源而不是整越多,给防守留下的余地越少。一个强队会自始至终保持很好的防守阵容,和相对较强的进攻阵容。所有比较好的欧洲强队似乎都有这个传统。
    南美虽然有一些{zh0}的球队,但是这一点似乎没有欧洲的对手做得好。

    • 须臾含霈 说:

      貌似除了“强队对弱队的比赛”,就是“实力很接近球队之间的比赛”了吧。。。

  7. 安徽卫视记者方博 说:

    我个人有点小小的观点,请大家来拍砖。
    我认为,足球就是足球,运动就是运动。纯粹的身体的释放,是一种game。不应当对他科学化数字化理论化。足球是身体的对抗,是体能的比拼,是意志的考验,是运气的垂青。那什么都看的这么理性了就没意思了。四肢与头脑是分属于不同的系统的。

    反正 足球和F1不一样。随意的去玩弄它吧。

  8. 叮当 说:

    “场的控球传球统计。” 应该为“而不是全场的控球传球统计。”

  9. 冰锋 说:

    啊!把网络分析的方法用到这个地方了?!
    个人认为,射门不中的数据也要考虑进去,这样的网络数据比较完善。
    另外,对不同的网络做一下聚类,给出不同球队的特征,对于确定方法的适用范围应该有帮助。

  10. kenzhon 说:

    本届世界杯上暂时表现最为团队的德国没人入选,说明这样的统计还是有局限性的。

  11. 说:

    梅洛世界第三?没有西罗?

  12. 叶自若 说:

    哎,感觉好多文章科学是科学,普及可就不太普及了,像我这种白弱文科半吊子,看得云里雾里的。。。。

  13. wiems 说:

    这样的数学模型对于长传冲吊,防守反击的球队以及机会主义的前锋,或者像范尼这类的禁区杀手不公平。

    • 说:

      巴蒂、碧咸之类估计也会吃亏。

  14. 说:

    德国没人入选,荷兰没人入选.
    换句话说,入选的除了西班牙都回家了.
    所以…

  15. 筋斗云 说:

    足协将来也来个API,每场球每个球员的各种数据自动产生,自然全球都会来搞模型了。

  16. 盘树 说:

    这东西,干嘛用来分析足球?分析篮球更可靠点。德国队曾经的89米助攻怎么算?足球这事,实力很重要,运气也很重要。

  17. 冷蟹 说:

    似乎这个算法考虑太多的个人能力,忽略了团队因素。不管是球队还是单个球员都不是质点,所以这样单纯数学计算欠妥。正如lifeshake所言。。。。。。

  18. 说:

    以前的CM,现在的FM,足球经理游戏,分析现实球员的能力很厉害。

  19. 沐湍泽 说:

    兰帕德也不简单啊~~可惜厄齐尔太年轻了,要不{jd1}得上去了~~

Leave a Reply

必填

必填,不会公开

选填

郑重声明:资讯 【科学松鼠会» 如果让科学家来选“国脚”】由 发布,版权归原作者及其所在单位,其原创性以及文中陈述文字和内容未经(企业库qiyeku.com)证实,请读者仅作参考,并请自行核实相关内容。若本文有侵犯到您的版权, 请你提供相关证明及申请并与我们联系(qiyeku # qq.com)或【在线投诉】,我们审核后将会尽快处理。
—— 相关资讯 ——