现在看个球都要懂数据分析了吗?
大数据文摘授权转载自果壳
作者:Timo
当下欧洲杯,除了夜半爬起看比赛之外,虎扑或者懂球帝的老哥们最喜欢做的事情之一,就是拿着每场比赛赛后球员评分,去“有理有据”地品评一番:C罗7.1分全队倒数他真老了吗?姆总7.5分他开心吗?英格兰全队平均只有7.06分,南门该下课吗?
明里是“研讨”足球,暗里则是参与一些竞彩小游戏。之前果壳欧洲杯相关文章的留言中,都能看见不少“大球小球”或者“三串一”之类的字眼,可见道友颇多。
而这两种乐趣背后,从评分到赔率,都离不开一套完整的数据体系。这套体系是媒体的大力丸,是球迷的文曲星,背后也是一门生意,和对世界影响深远的一种Data-Drive意识。
谁在给球员评分?
如今我们每场看到的数据评分,大都来自两个来源:SS(SofaScore)和WS(WhoScored)。有的时候,两家的评分大体都能符合比赛中的预期,但是评分结果并非完全一样。比如在英格兰VS斯洛伐克的欧洲杯八分之一决赛中,在菲尔-福登的表现上,二者就出现了很大的差异:SS给福登打出了7.1的评分。而WS则给出了6.4的低分,在首发中和梅努并列最低。和福登一模一样的是科比-梅努,同样是WS 6.4而SS 7.1。

英格兰VS斯洛伐克 SS评分 +|SofaScore
成立于克罗地亚的SofaScore和成立于英国伦敦WhoScored都是著名体育数据公司,可以看到他们的评分都采用了标准的10分制,其数据源也有重合之处(比如都会使用Opta的数据,其中WS是完全使用Opta的数据,SS是部分使用),二者的评分差异是从他们的算法上来。
虽然二者都未公开过自己的算法,但是通过媒体报道还是能够看到一些端倪,WhoScored评分只在赛后更新,倾向于整场比赛完结后,将球员的每个动作的数据细节进行彻底分解,并赋予某些重点动作更高的权重(如关键传球、成功拦截、过人等),对于一些负面动作(如失误、犯规、红黄牌)的惩罚也会更加严厉。比如科比-梅努在比赛中吃了一张黄牌,在WS的评价体系里扣分就会更多。而福登多达21次的丢失球权,也许就成为他评分较低的原因。
相比之下,SS的评分在比赛开始10分钟后就会实时更新,每场比赛中评分会更新60次,整体偏重于“对比赛最终结果带来的影响”上,影响评分的是“主要积极因素”和“主要负面因素”,对帮助球队取得胜利的积极因素会有更高的奖励。因此合理推测,福登有因为有2次形成射门的传球,其中造成了1次创造得分机会,形成了0.14的xA(预期助攻),可能让数据判断他对比赛胜利造成了一定的贡献。而同样7.1分的梅努有一次漂亮的过人射偏,带来了更高的xG(预期进球),也同样被计入了更多贡献。
SS的评分更偏向重点行为对比赛的影响 | SofaScore
类比来说,SofaScore的评分,类似于 FIFA 游戏中对球员的评分,考虑了比赛中的关键事件和整体表现,只要赢球且出场时间足够评分就不太会低,非常适合“嗨圣二象性”的球迷;而WhoScored的评分类似FM(足球经理),不管比赛结果如何,都看具体数据细节来进行深度分析和评估,有时候反直觉,但其中的道理经得起琢磨。
点球成金
贝内特·米勒执导,布拉德·皮特和乔纳·希尔主演的电影《点球成金》(Moneyball),这部电影讲述了一个真实的故事:奥克兰运动家棒球队的总经理比利·比恩在预算有限的情况下,与耶鲁大学经济学毕业生彼得·布兰德合作,革命性的利用“棒球统计学”(Sabermetrics)来评估球员并组建球队,在没有明星球员的情况系创造了MLB的美联连胜纪录并打入季后赛。
图片来源:豆瓣电影
低投入能拿好成绩,好成绩意味着体育商业里的高回报。随着这套“金球理论”(Moneyball Theory)体育投资者的共识,之后许多年,我们就看到了这样的场景:
一大批体育数据公司得到了快速发展,上文提到的WS和SS平台,都与背后的溢价Opta Sports有合作,后者是全球最有影响力的数据公司,比赛每场足球比赛收集的事件数据多达 2000+ 项,把一场比赛中球员和球队的行为彻底数据化。而与之类似的公司,还包括Stats Perform、Wyscout、Instat、Football Benchmark等等,他们也不仅仅覆盖足球,包括NBA、MLB、NFL、F1、板球等所有商业价值较高的运动,不仅已经充分数据化,而且数据都极具商业价值。
Opta Sports的数据服务涵盖了众多项目 | statsperform.com
这些数据给球迷们看,无非是拿着互相打打嘴炮,除了媒体、广告和球迷服务,其更重要的买家,就是足球俱乐部,以及博彩。
足球俱乐部购买数据主要用于两个方面。其一是针对比赛,用于自己和对手的战术分析,扬长避短的争取比赛胜利,同时监视球员的状态和伤病情况。比如说布莱顿主帅德泽尔比就曾经在连续多场比赛后,监测到如三笘薫、邓克等核心球员已经在密集赛程中超负荷运转,虽然球队很需要他们,但是不得不放在替补席,而在比赛中采取更保守的策略。
布莱顿的球员价值相比于购入时往往有巨大提升 |transfermarkt.com
其二是针对球员交易,通过详细的数据,以及高阶的数据分析,球探团队可以在人手有限的情况下,在全世界挖掘更多好球员,并更有依据的决策是否招募。比如说布莱顿从厄瓜多尔挖掘了凯赛多和埃斯图皮南,从日本挖掘了三笘薫,从爱尔兰找到埃文-弗格森,从阿根廷找到了麦卡利斯特,他们转入布莱顿的价格都极低,后来或者为布莱顿带来了丰厚的利润,或者拥有极高的身价。
而对于足球博彩来说,庄家和赌徒,也都需要数据。对于接受投注的博彩公司,他们的精算师会使用详细的比赛数据和高级分析来设置精准的赔率,通过实时数据和比赛进程分析,博彩公司可以在比赛进行过程中动态调整赔率,由此评估和管理投注风险,保证自己稳赢。
但与此同时,厉害的赌徒同样可以通过数据分析让自己赢。2006年,英国商人兼数学家托尼-布鲁姆(Tony Bloom),利用复杂的数据模型和统计分析来预测足球比赛的结果,帮助大宗赌徒(他们只愿意接受至少投注200万英镑的客户)投注亚洲让球盘(Asian Handicap)并收取佣金,根据We love Brighton的报道,这门生意每年给他们带来了1亿英镑的收入。
托尼-布鲁姆 | wearebrighton.com
而赚到钱的托尼-布鲁姆随后收购了从儿时一直支持的俱乐部——布莱顿。
是的,托尼-布鲁姆的布莱顿就是现在“数据足球”的标杆,也被许多更大的俱乐部模仿,比如切尔西以及利物浦(虽然未见得模仿得很成功)。随着这股风潮逐渐的蔓延到世界上的每个角落,球迷、球队、赌博、商业以及资本,全部由数据交织在了一起,可被量化的体育也成为了全球资本的香饽饽。
根据Fact.MR的分析展望,2024年全球体育分析市场(Sports Analytics Market)规模预估为46.6亿美元,预计到2034年将达到594.7亿美元,年复合增长率预估达到29%。分析指出,以统计数据为基础的数据分析、物联网、媒体、体育粉丝服务,将成为关键的市场增长动力,并彻底改变体育比赛的传播与消费方式。
那么,代价是什么呢?
赛博体育?
体育数据分析的崛起,实际上是全世界对大数据叙事狂热的一个缩影。
2010年,硅谷营销专家肖恩-埃利斯提出了著名的Growth Hacking(增长黑客)概念,将传统统计学、大数据、计算机技术和营销洞察等跨领域的知识,统一成利用数据去带动整体增长的方法论。
图片来源:Amazon
人们发现了元数据(Metadata)是一座金矿,可以快速带来变现机会之后,致力于将其用在已知的所有地方。与很多领域(比如浏览、购物行为)的用户数据都是非结构化不同,运动场上的运动员们,遵循统一规则,在标准的场地上进行比赛,所有的数据都是结构化的:每次传球、射门、防守动作等可以被预定一,如进球、助攻、黄牌、红牌都有明确的属性和类别,通过人
请先 后发表评论~