当前位置 > 首页 > 专家访谈 > 足球的大数据分析: 访谈Dustin Bottger

足球的大数据分析: 访谈Dustin Bottger

来源:中国数据分析行业网 | 时间:2015-09-24 | 作者:中数委

全球足球网络的主要目标在于彻底变革现代球探网络运行模式。在迈克-刘易斯(Michael Lewis)的全球畅销作品《点球成金》(改编自迈克-刘易斯的《魔球:逆境中的智慧》,电影讲述了奥兰克运动家棒球队总经理比利-比恩的经营哲学,描写了他如何以小博大、力抗其他薪资总额比他们多上数倍的大球队的方法)的影响下,足球人一直致力于考量对于职业足球更加有效的探查并且基于此创造一套独特的评分系统(GSN-Index:全球足球网络指数)的可能性。

Q:从数据分析的观点,您在面对收集数据时经常会面对哪些困难?

A:最大的问题在于,我们需要从所有相关的比赛中持续收集有价值的数据。我们必须保证数据库中的每名球员都有同样数量的比赛数据,唯有如此,我们的体系才会有意义。因为我们和很多家数据公司以及足球分析专家建立有合作关系,所以我们完全不用担心数据的收集问题。

Q:请给我们提供关于GSN指数以及它的运作方式的更多的细节。这个系统需要考虑什么?有哪些独到之处?

A:我们想创造一套世界上最具全面性的球员评估系统。所以我们开发了GSN指数,这个指数由四大支柱系统组成。这是对于这四个系统的一个简单的描述:

1.足球相关特性(SRC):GSN指数的基础是评估以及数据化对于球员来说至关重要的相关特性(70项以上)。为了尽可能达到客观公正,每名球员将会分别对数名不同的球探近距离考察。评估包括技术能力、战术理解力、精神属性以及身体素质四大方面,这四方面将最终综合为0-100的总分。然而没有任何一名球员能达到100分的满分。最终的评分将经由一套考虑到球员位置属性的复杂计算得出。相比于前锋,一名中后卫需要不同的能力,而我们的系统将自动将这方面的差异纳入计算过程。对于所有在我们数据库中球员的评估将根据我们的全球球探系统定期升级。

2.潜力值:这将是各俱乐部购买球员时最看重的因素之一,同时怎样在这一方面有所提高也是我们未来工作的重心。甚至在今天,各俱乐部会为了一些年轻球员和天才少年一掷千金。所以,能否在其职业生涯早期认识到一名年轻球员的潜力就变得格外重要,这将有利于球队利用合同条款趁早占有这些未来之星。

GSN开发出了一个基于改进过的的经济和财政运算法则之上的系统。许多因素将被列为能够影响球员发展轨迹的关键要素从而被考虑进去,例如教练的水平和足球教育水平的高低、学习能力、年龄等等。起始分数为0.00分(没有任何潜力可挖)。数值可以一直到达满分。数值越高,潜力越大。

3.+/-值:+/-值是GSN指数四大支柱系统中的第三个系统。根据球员们在球场上的实际表现,他们的分数会因为积极的表现得到提高(进球、助攻、点球扑救、传球成功率等等),同理,球员们的分数也因为消极的表现遭到削减(乌龙球、红牌、传球失误等等)。数值100代表着一个平衡的+/-数值,即没有加分也没有减分。如果数值超过了100,这代表着这名球员的积极表现超过了消极表现。同理,如果一名球员的得分低于100,那么他在场上的消极表现多过了积极表现。当然,数据也同样会考虑到球员的位置问题。同样的进攻行为,防守球员和进攻球员的评分会有所差异。

4.比赛水平:比赛水平是GSN指数中最后一个但同样很重要的一项。在这个系统下,我们有能力分析以及评估在一名球员的职业生涯中的每一场比赛。每场比赛的分数都介于1到20之间。20分代表世界杯决赛或者欧洲冠军联赛决赛,而1分则多代表一些青年级别联赛以及业余比赛。这个系统也会根据球员年龄以及上场时间进行调整,比如一名19岁的球员在德甲联赛中踢满了90分钟,他会比一名30岁并且踢满90分钟德甲比赛的球员得分更高。比赛水平越高,GSN指数便会更高。

同时我们也使用夏普利值(译注:夏普利值指所得与自己的贡献相等,是一种分配方式),它能帮助我们显示一名球员在多大程度上影响了比赛。由以上四个支柱系统得出的最终数值形成了GSN指数。

就像我们上面提到的,这是一个全世界最全面的球探系统。我们的系统把来自不同联赛、国家、赛事以及年龄层的球员的比较变成了现实。这套系统也使得各俱乐部负责转会的决策者更加有迹可循,他们能更加便捷的分辨哪些球员是被低估的,而哪些球员则名不副实。我们能够对全世界超过340000名球员进行评分。我们也有能力创造一个价格-表现比率,这个比率显示了一名球员是否物有所值。这完全符合点球成金式的足球风格。

Q:现如今锋线球员的数据能够轻易反映其场上表现,然而这套系统在反映防守球员表现的相关数据分析以及评定方面有任何提高么?

A:球场上发生的每一个细节都被我们详细记录以及保存了下来,包括防守行为中的铲断、拦截以及头球等等。现在我们也能够通过数据观察哪名球员应该对失球负责或者与之类似的重大失误。我们将这些场上行为转换成与失球相关的数值。不仅仅是传球成功率,犯规、助攻以及其他与进攻相关的指标都可以作为我们评估一名防守球员优劣的标准。

Q:你能更深入地介绍一下记录以及评估球员的这套参数么?当你们跟踪观察一名球员时,为什么一些特定的参数的比重会压过其他一些更显而易见的参数呢?你们在参考这些参数的时候,有没有刻意的强调其中某些参数呢?

A:我们会尽可能地对一名球员的全部信息加以搜索(因特网、报纸、杂志、电视节目等等)。比赛报告、伤病报告、比赛数据等等,还有我们的球探报告。把所有这些信息汇总成一个GSN指数是一项浩大的工程。

在如此众多的信息中,比赛数据对我们来说最为重要。我们的计算公式会引入每场比赛的每一个场上事件作为计算+/-值的基础。特别是场上那些关键参数(进球和助攻无疑最为显著)将比其他的参数更具说服力。至于其他的,涉及到公司商业秘密,恕我无可奉告。

Q:现在所有人都在关注足球场上的数据分析,行业内的先行者们早已表明统计(stats)和度量(metrics)指标是完全不同的。你能给我们更深层次的探讨一下这个命题么?

A:指标表示的是一种能告知我们有关事物发展变化的信息的数字。在这里,GSN指数就是一个指标。一个指标有其自身所代表的意义,并且有一套得出它的计算流程,我们可以清楚地定义指标并且精确地将其计算出来。参考指标具有十分重大的意义,它能便于我们观察事物的发展趋势,并且可以将不同时期的度量指标放在一起横向比较,因为我们早已知道他们是按照相同的方法计算出来的。

而统计只是一些原始的数据,他们被直接用来观测和判断,统计数据将被用来计算度量指标。

Q:根据你的经验或是认识,全球范围内,哪些俱乐部在利用数据分析方面做得最为出色呢?

A:我认为是米迪兰特队(丹麦)和布伦特福德队(英格兰)。马修-本汉姆(Matthew Benham)和拉斯姆斯-阿科尔森(Rasnys Ankersen)是数据分析的先驱,并且他们借此彻底改革了两队的球探部门。

阿尔克马尔现在处于比利-比恩(Billy Beane)(译注:前美国职业棒球大联盟奥克兰运动家队总经理,其新奇的球队管理经营方式也因作家麦克-路易士的《魔球——逆境中制胜的智慧》一书而闻名,该书于2011年改编为电影《点球成金》)的领导下,也逐步走上了正确的道路。

另外我还想提一下几支大联盟球队,比如新英格兰革命队、堪萨斯城竞技队或者多伦多FC队。他们经常在以数据为主导的体育赛事上经行分析,例如篮球、美式足球(橄榄球)以及冰球,并且经常能够引入创新的并且很有见地的分析方法。很显然,小球队会试着用数据分析来创造竞争优势。

Q:有没有这样一种球员,他们并不被人熟知,然而根据你们的数据分析模型,他们完全有资格得到更多的认可与更高的评价?

A:有一些球员被严重低估了,而也有一些球员被高估了。米迪兰特队的丹麦年轻黑人边锋皮奥奈-西斯托(Pione Sisto)是个名副其实的数据狂人。基于我们的GSN指数模型,他已经达到世界级水准了,然而在丹麦以外,没有人注意到这一点。除了他,还有很多这样的球员。

Q:我们了解到这个创意很大程度上来源于《点球成金》这部电影,然而相比于像棒球这种非连续性的比赛类型,在连续性很强的足球比赛中持续的进行数据分析有多大的难度?

A:我听说过,也读到过这种说法很多很多次,但是说实话,我不明白这是什么意思。如今球场上发生的一切都在被记录着、分析着。或许对于棒球来说,记录一整场足球比赛要更加困难一些,不过如果更加专心地跟进关键指标并在合适的比赛背景下正确地分析它们,你将不会在分析足球比赛数据上遇到任何问题。数据分析的反对者们只选择相信自己的双眼所见,而争论仍将继续进行下去。

Q:在数据分析正在被广泛应用的当今足坛,你们遇到的最大挑战有哪些?

A:最大的挑战在于俱乐部决策人的心态。他们中的很多人担心数字化会使他们丢掉工作,这绝对是错误的。没有具备了经验和专业知识的管理人员,数字化就无从谈起。如果没有我们合格的长期工作在全球各个角落的专业球探,我们的网站就无法提供内容翔实可靠的GSN指数。

当使用我们的系统时,球队不应该更换经理、教练、体育主管或是球探,相反,我们的产品应该为他们所用并帮助他们提高工作效率。我们给俱乐部的建议很简单:接受新技术,采用新的思维方式,把这些先进的思想介绍给你们经验丰富的雇员。

Q:一些专业足球数据分析网站,比如Squawka.com和WhoScored.com给足球发烧友们提供了免费的数据。这些网站所展示的数据和俱乐部所使用的数据有什么不同么?

A:首先我必须得说Squawka.com和WhoScored.com都是非常好的网站。他们提供的数据和俱乐部实际使用的数据的差异很难说清,因为各俱乐部侧重点不同。一般情况下俱乐部倾向于掌握更多联赛、国家以及各级赛事的数据。Squawka.com和WhoScored.com只覆盖了和他们的球探切实相关的联赛和球员的数据。俱乐部同时也会从他们内部的医疗部门以及训练场上得到其他人得不到的数据。

Q:即便是数据分析能够将体育更深层次的东西以数字的形式展示出来,然而这种形式的量化仍然不能像传统的球探跟踪的方式那样将球员的身体以及技术能力全方位的表达出来。单纯的数字分析将有可能因为一组不完整的数据而忽略了一名球员真实的身体或是技术能力。你认为这个说法有道理么?

A:绝对不是这样!如果你拥有富有经验且知识渊博的球探以及精细的数据表格,你完全有可能将一名球员的身体或技术能力通过数字的形式表达出来。GSN数据库中的每一名球员都在被不同的球探在独立的基础上定期跟踪观察。他们的报告内容将被转化为数字的形式。这种建立在常规基础上的方式将最大限度地保证客观性。通过这种方式,我们将得到有关多重属性的精准的数字。

Q:最后,一个传统疑问,数字会说慌么?

A:数字最终不能百分之百地反映一个球员的各种属性,但是可以非常接近。对于球员以及球队的真实情况的每一个百分比的精确认知都将使我们在成功的道路上迈出重要一步。

翻译转载自http://outsideoftheboot.com/2015/09/24/insight-into-data-analysis-in-football/