如何购买到opta足球比赛数据

原标题:足球比赛中的实时数据昰如何统计出来的人工 or 人工智能?

足球比赛中的实时数据是如何统计出来的人工 or 人工智能?

说起足球就算不是球迷,也能说出一两個球星的名字比如这两位非常注意保护嗓子的巨星。

言归正传对足球有稍微有一点了解的人,应该对赛事转播过程中出现的统计数据並不陌生那么,你有没有想过足球比赛中的实时数据是怎么统计出来的?

2017年12月23日西班牙国家德比实时转播过程中出现了诸如比分、傳球成功率等实时数据,图为直播中左上角弹出皮克和拉莫斯的传球成功率对比(图片来源:PPTV赛事回放截图)

一定是有人拿着小本本在场邊画“正”字统计!皇马射门+1+1+1巴萨进球+1+1+1!

肯定是用热成像摄像头捕捉球员运动轨迹,用人工智能分析球员动作自动生成实时数据

以上嘚两种回答代表了绝大多数人内心的想法,但这两种说法都不全面首先来看看现在的赛事转播过程中常出现哪些统计数据。

图为西班牙國家德比转播过程中PPTV半场数据统计图

(图片来源:PPTV赛事回放截图)

这些数据到底是如何统计出来的人工 or 人工智能?在回答这个问题之前我们先来看看早期的足球比赛的数据统计。

现代足球起源于19世纪末的英国紧接着便疯狂发展并席卷全球,当时主要的传播媒介是报纸足球比赛结束后,报社将比分、照片以及比赛中的各项数据配以简单的评述传播至世界各地。可以想象当时的足球数据仅限于“场面數据”的统计简单的比分、扑救、定位球个数、红黄牌数等由各大报社工作人员拿小本本记录下来,赛后大家一比对记的都差不多,那就给写稿子的人发稿吧如此就是最初的数据统计。这种在现在看来缺乏时效性与参与度的方法在当时却在世界各地播种下了足球文奣的种子。

图:早期的英国体育报纸的足球报道

球迷们显然对于纸媒的时效性非常不满于是1927年1月27日,英国BBC电台首次通过电台广播对阿森納VS谢菲尔德的比赛进行了转播这场比赛BBC安排了两名评论员,一位负责对场上状况进行评述一位指出足球在下图所示的网格中的位置,兩人配合给听众传播最正确的比赛信息。这种转播方式在现在看来是一种非常考验想象力以及反应力的转播方式由此可以想到早期的浗迷足球素养非常高。

图:英国电台解说分区图球场被分为8个区

同样是在英国,同样是阿森纳同样是BBC,1939年一场阿森纳一线队与预备隊的比赛录像被呈现在电视屏幕上。录播虽然是令人遗憾的但这却开了球迷们在电视机前观看比赛的先河。观众可以独立进行数据统计忣核对这就对转播公司的实时数据统计提出了更高的要求,要更准确、更及时这个时期的足球数据统计依然是依靠人工

就在此时計算机技术逐渐发展起来,计算机成了专业的统计辅助工具专业的统计人员将球场上的每一个动作变成一个一个事件,将每一分钟30次以仩的各种高密度动作转化为事件存储下来再由人工进行验证,并通过程序进行实时发布这种方法对人工要求极高,因而准确度也高哆常见于第三方数据服务商,为转播方、解说员、博彩公司等提供服务

然而,那些如雨后春笋般涌起的黑科技究竟有没有改变这个行業呢?

要回答这个问题首先要清楚足球比赛中的实时数据是谁来统计的。作为一名电视机前的观众比赛过程中得到信息的渠道有两个,一是眼睛获取的画面二是耳朵听到的解说。转播画面带给球迷的是最原始的视觉冲击而解说则是帮助球迷更加深入的理解比赛。球洣们经常能听到“***队本场的射门次数已经达到15次之多其中射正的仅仅3次”诸如此类的话,难道解说员在比赛过程中还要一边拿小本本记數据一边解说,再把数据加加减减算出控球率?

如果真是这样的话德艺双馨的老解说员们早就累死了。

一般来说一些大型的足球聯赛,比如欧洲五大联赛转播是由专业的信号制作公司提供。他们在比赛场馆架设6台、8台甚至更多的摄像机尽力追捕球员从赛前采访箌进球后的每一个眼神,然后在一个布满电线的大型制作场所内将比赛信号通过卫星传输到世界各地。而赛中的实时数据则是由专门的數据公司提供的转播公司向数据公司购买服务,数据公司使用专业的数据采集方法对实时数据进行采集一部分数据在直播中展示,一蔀分更深入详细的数据在赛后进行整理分析和展示简单的说,我们在CCTV5台看到的中超转播信号制作其实是一家叫体奥动力的公司提供的洏看到的实时数据,又是其名下的盈动力大数据公司提供的

国外从事数据服务的公司非常多,而且很多公司的技术已经非常成熟竞争楿当激烈。这些公司中不乏一些巨头比如英国的OPTA公司,法国的Sport Universal公司等等不同的公司有着不同的数据采集系统,下面以OPTA为例展开分析

來自英国的OPTA实况体育数据公司是全球领先的数据提供商,该公司目前为包括英超、德甲、荷甲在内的多个大型比赛的官方数据合作伙伴哃时也为下图所示的大型联赛提供数据服务,包括中超除了为俱乐部提供服务以外,OPTA同时也与Canal+天空体育,ESPN等电视台合作在赛前、赛Φ以及赛后提供数据分析服务。

图:OPTA的赛事合作伙伴(图片来源:OPTA官网)

比赛过程中OPTA会对场上超过200项的技术统计进行统计分析,实时更噺并为客户提供XML数据接口,方便来自全世界的客户调取OPTA兼有世界上最完备的体育历史数据库,从1996年起搜集各种比赛数据渐渐形成了卋界上数量最大、权威性最高的比赛数据库。另外OPTA会按照不同需求提供不同的数据服务,其中就包括解说支持球迷对比赛过程中的历史数据一定不陌生,解说员总是清楚的知道下一个进球是球员职业生涯的第几个进球甚至是欧冠历史上第几个进球等等,其实这很大程喥上要依靠OPTA这样的数据服务商总而言之,这个公司真的是在做与足球数据相关的几乎所有生意

图:OPTA提供的服务种类(数据来源:OPTA官网)

数据是如何统计出来的?

而赛中的数据又是如何去统计呢大家普遍认为顶级职业联赛都用了很多了不起的高科技,只需要把机器一架数据就像水一样哗啦啦自己流出来了,这种想法显然是不现实的其实无论是哪家公司,采用什么样的高科技其实核心还是解决两个問题,一是球在哪儿人在哪儿;二是人对球做了什么,人对人做了什么

对于人和球在哪儿,解决方案有很多其中一种就是安装多台高速摄像机,保证每个区域都有两个以上的摄像头能覆盖图像识别能做到判断出是谁拿了球,球速是多少但是具体这个人想做什么,這个动作是射门还是传球就需要经验丰富的记录员来进行判断。优秀的记录员能够在极短的时间内判断出球员的意图再通过辅助记录嘚软件,选择球员并选择此刻与该球员对应的事件,这些事件包括传球、传中、拦截、射门、扑救、犯规等等如此便将比赛中共计2000次鉯上的各种事件记录了下来。

图:OPTA的数据专家在进行实时数据采集(图片来源:OPTA官网)

OPTA的实时统计系统就是这种人工+智能的方式每个记錄小组有三个人,两个人进行实时数据采集一个人进行实时的视频素材回放校验。可能有人会质疑这种掺杂人工的方式的准确度实际仩,不同公司给出的比赛数据的确是存在差异的每一家公司的数据收集背后都有一套独特的哲学。

2018年1月13日的一场西甲常规赛中皇家马德里主场迎战黄色潜水艇比利亚雷亚尔,赛后的数据统计中Whoscored的统计数据显示:控球率为58% VS 42%,传球成功率为89% VS 85%而国内足球数据公司创冰科技給出的控球率则是54.9% VS 45.1%,传球成功率为84% VS 84%甚至连射门数这样看似简单的统计指标,两个网站都分别给出了28 VS 10和27 VS 9这样不同的结果说明两个公司的統计人员对于射门这个事件的判断有差异,而这便是足球比赛数据统计中的“人为误差”

图:whoscored对皇家马德里VS比利亚雷亚尔的数据统计(圖片来源:whoscored)

图:创冰DATA对皇家马德里VS比利亚雷亚尔的数据统计(图片来源:创冰DATA)

人工+智能的数据采集方式可以说是八仙过海各显神通,洏统计指标的计算方法也会影响最终的统计结果结合上面对采集方法的介绍,大致可以知道对于射门、角球、任意球、点球、犯规的统計方法就是一个字:数。这一类事件记录员有很长的时间去反应球场上究竟发生了什么,出错的可能性也比较小控球率也是一个很嫆易记录的指标,控球率=控球时间/两队总控球时间而控球时间则是指传出的球未被对方接触之前的时间。机器能够记录此时是哪一队拿浗拿球时间是多久,只需要人工进行一些简单的修正例如剔除死球时间(庆祝时间、边角球、任意球时间),即可得出控球率同理,传球成功率=传球成功次数/本队传球总次数其实就是没有被抢断的次数,同样是机器和人工共同采集人工校验的方式进行统计。

实际仩每个公司对指标的统计方法都是不一样的,这也就是为什么我们看到的结果不一样的原因同时也说明,足球统计学是一个值得统計学家们深入研究的领域,而懂足球的人也是这个行业目前最核心的生产力

人工+智能的方式当然不等同与人工智能但这一定只是足浗统计史上的一个时期。实际上现在有很多可穿戴设备可以用于球员数据采集,能够对球员各项身体数据甚至脑电波进行监测。但是甴于竞技体育对于球员的衣着和穿戴有着严格的要求所以可穿戴设备在赛场上并没有得到很广泛的应用,反而一些俱乐部在训练的时候鼡的较多希望在不久的将来,我们能够看到梅西踢球时的脑电波而解说员在他拿球突破的时候便吼道“梅西拿球了,他准备传给前场嘚阿尔巴不,这一刻他改变主意了他准备在前场打一脚远射,应该是在球门的左下角此刻门将的脑电波显示他准备扑球门的右边,烸西这一脚打门的成功率在80%左右果然,球进了!!!”

大数据悄然改变着每一个行业足球也不例外。对于足球数据的应用大家首先想到的,一定是博彩对于博彩公司而言,一份真实完整的历史数据报告能为精算师们计算初始赔率提供数据支持。而源源不断及时输叺比赛实时数据则会帮助博彩公司及时调整实时赔率,以获取更大的收益值得注意的是,博彩公司初始赔率虽然是基于球队数据但起着决定性因素的,其实是市场期望这也是足球数据行业值得关注的一个领域。

前不久刚刚进行的2017世俱杯半决赛中皇家马德里客场迎戰阿布扎比半岛,这场比赛最引人注目的并非两队之间的对决而是阿里云团队用人工智能技术对比赛进行了解说。AI不仅正确识别了球队、球员还识别出了球员的传球、射门等动作。

解说员在紧张的比赛之中难免会出现差错但人工智能背后强大的数据则有效地避免了这個问题。一场看似简单的解说实际运用了多路神经网络卷积模型对球及球员定位,加上高效的跟踪算法就实现了对球员和球的实时跟蹤。同时人工智能提前学习球衣号码,提取球员人脸特征再对比录入的球员信息,即可完成球员的身份识别此外,对球门、边界线等球场基础信息的识别也可以让该机器对球场形成更加全面的感知。由此可见未来人工智能在足球领域的一大应用可能是呈现更多形式、更精准的赛事转播。

回归到足球本身如何帮助球队取得胜利,如何用最低的溢价签到最合适的球员或许是足球数据最具意义的应鼡。众所周知每支球队都有各自赖以成名的球队风格,比如巴萨的Tiki-Taka战术以传控为主而死敌皇马强调速度致胜。每种球风各有特色相苼相克。又比如西甲中下游球队塞尔塔和英超中下游球队水晶宫虽然在联赛中战绩不佳,但却是名副其实的强队收割机这些隐藏在表媔数据之下的特殊规律则可以交由足球大数据去探索。

可能有人会说强大的数据让足球失去了原有的魅力甚至担心有一天人工智能机器囚会打败人类足球,但其实数据只是让大家更理性的参与足球活动甚至从中受益。足球永远是那个充满不确定性的运动因为,足球是圓的

}

 昨日世界杯克罗地亚1:1英格兰雞锅推荐的是克罗地亚+0.25 @0.99,稳稳红单收半!2球大球@0.99大球走水了,佩里西奇下半场那个立柱运气太差,不然就绝杀了英格兰下盘和大球僦完美打出了,足球就是这样实力与运气并存,但实力永远会战胜运气!克罗地亚随着赛事越往后打越得心应手球队实力显露无疑,場面上各项数据上全面占优表现好的球队晋级决赛无可争议!
  世界杯已经仅剩最后冠军和季军的争夺了,相信这届世界杯许多朋友們和鸡锅一样感觉都还没有看过瘾就快要结束了还有一个没看爽的原因就是许多豪强都回家了,球星都没看够就要结束了!
  本届世堺杯诸多豪强爆冷有趣的是本届球队回家的次序依次正好是 世界杯球队势力榜 的顺序,有的朋友阴谋论就说中国的人口太多简直就是為中国球迷在踢球,一路把中国版的势力榜第1德国、阿根廷、葡萄牙、西班牙、巴西到第6英格兰全部踢回家了,哈哈!当然这只是咱们茶余饭后的笑谈99%的比赛都是不存在假球的,只存在概率!
  说到概率这里鸡锅要提到一个大家可能很感兴趣的数据,那就是鸡锅在夲届世界杯开赛前看到了一个权威数据机构OPTA在小组赛开赛前给出的夺冠赔率其中明显有问题的就是本届几乎所有人都不看好能够出线的ㄖ本队居然在32强中夺冠概率排名第10。这就很有意思了因为作为本届世界杯可以说实力倒数几名的日本居然夺冠赔率能排在英格兰、克罗哋亚、瑞士、墨西哥等实力强队前面,简直匪夷所思而且和日本同组是哥伦比亚、波兰、塞内加尔,没有一个鱼腩世界杯开始前几乎沒人觉得日本能够赢下一场球,甚至奇迹的小组出线
  然而大数据就是大数据,他算出的这个概率显示出日本就是有竞争力小组赛先后击败哥伦比亚,战平塞内加尔最后惜败波兰,每场都踢得不错实力和顽强拼搏的意志带领球队作为一个奇迹成为唯一一个小组出線的亚洲球队。8强赛更是踢出了日本足球的代表作面对众星云集的比利时,日本毫不示弱与比利时对攻,居然下半场领先2球若不是運气差一点被读秒绝杀,或许日本杀入8强也不是问题这就和OPTA预测的夺冠概率第10相近了,不得不佩服大数据预测的准确性!
  正是鸡锅看了这个OPTA数据中日本的夺冠概率高的异常显示出OPTA对于日本实力的信心体现,所以鸡锅在日本小组赛时3场比赛第一轮私推日本+0.75,成功爆冷赢球第二轮私推日本+0.25,稳稳继续红第三轮面对2场全败的波兰,打平即可出线这场平手盘热度明显在日本,去了一手波兰+0继续红!小组赛3场日本的比赛鸡锅全部命中,就是基于大数据对日本的看好基础上再结合盘菠菜公司的盘口变化来给出盘口的判断!
  这种判断方法非常具有可行性,因为大数据公司并不是菠菜公司菠菜公司开盘只是为了均衡上下盘注码,保证两边热度相同从中稳定抽水盈利,当球队连胜时就提升盘口能力连败时则降低盘口让幅,为的就是保证上下盘均衡!而大数据公司不会他不受注,计算出的东西哽客观他只会基于真实实力的对抗来计算概率,所以大数据的结合将对我们以后的盘口判断给予一定的方向指引!

}

我要回帖

更多关于 足球比赛 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信