澎湃Logo
下载客户端

登录

  • +1

张佳玮|谢谢老师!你的大数据让我了解“科比詹姆斯谁更强”

张佳玮 著名作家
2015-09-10 11:39
来源:澎湃新闻
运动家 >
字号

【编者按】

如今当我们谈起NBA,某某球员的数据总是挂在嘴边,但你知道NBA的数据统计是如此兴起的吗?它又经历了怎样的变革?

在大数据时代,约翰·霍林格老师创立的统计系统也许将轻松解答球迷间的争议。科比和詹姆斯谁强?看看这些精确到分毫的数据吧。

在社交网络时代,想精准说明一件事,只需要足够多的数据而已。

数据时代,整整走了40年

1946年11月1日,纽约尼克斯做客多伦多壮汉队,68比66取胜。这是一切的起点:NBA就此开始(那时候还叫做BAA)。

那个赛季,没人统计篮板球,没人统计抢断,盖帽、失误更是无从说起。列入统计的只有以下数据:

投篮出手;投篮命中;罚球出手,罚球命中;助攻;犯规。就在那场著名的开天辟地创世战里,你只看得到一份手写的模糊的数据单:

半场37比29,全场68比66,纽约全场犯规20次,多伦多16次。全场得分首席是多伦多的诺斯特兰德,18分。

1950-1951季,一个伟大的变化出现了:篮板球开始被统计了。当然,那时节NBA依然没有电脑数据库,所以统计全靠手写+收集。

1973-1974季,张伯伦刚退役,NBA就开始统计盖帽数据。于是,拉塞尔和张伯伦那些“单场25次盖帽”、“职业生涯每场都有10次盖帽”,只剩下传说了。

同一年,NBA开始统计抢断,杰里·韦斯特在他35岁那年留下了场均2.6抢断,也让人不得不考虑“如果从1960年就开始统计抢断,韦斯特会留下什么样的霸业?”

1977-1978季,NBA开始统计失误数;80年代,三分球加入之后,数据统计基本成了型。

1986-1987季开始,NBA每场比赛都有了完备的、准确的个人技术统计框,所以很长一段时间里,新闻都爱用这字眼:

“自从1986-1987赛季有统计以来,这是第N个球员单场打出以下数据……”自那以来,NBA的统计正式进入了现代。你可以从www.nba.com、www.basketball-reference.com等地方,随意找到历史数据。

詹姆斯在一场比赛中的具体数据。

球迷的困惑数据能解答吗?

与此同时,因为数据的完备,一切都改变了。

20世纪80年代中期,随着电视转播的兴盛,媒体对NBA的渗透也日益加重,大量的数据引用成了媒体的新爱好。

于是,“得分能手”、“强悍的防守者”、“快手”、“投篮大师”这些词汇,逐渐被“每场能得多少分”、“能完成多少个篮板+封盖”、“能完成多少次抢断”等话题覆盖了。

如是,自上而下,NBA都开始喜欢数据了。

但对大多数球迷来说,他们面临这么个问题:他们没法看每场比赛,只好靠数据来分辨,于是有了以下问题:

后人看数据,会很难理解:年轻时的斯蒂芬·马布里,一个年年场均8助攻以上的人,怎么会被叫做独狼?

后人看数据,会难以想像,布鲁斯·鲍文这个平淡无奇,抢断毫不华丽的家伙,防守却远比两届抢断王“魔术师”强大?

后人又怎么能想像,斯塔德迈尔职业生涯场均1.4次盖帽8.8个篮板和加内特差不多,但KG的防守和斯塔德迈尔,那就是水泥和泥水之别?

约翰·霍林格创立了球员效率水准统计。

数据告诉你“科比和詹姆斯谁强”

轮到我们的主角登场了:约翰·霍林格老师。

如今已上任灰熊篮球事务主管的霍林格老师,过去十六年一直在致力于篮球数据发掘。他首创了PER制度——即Player Efficiency Rating(球员效率水准),来统计一个球员的综合效率。

虽然这个指标常被批评缺少防守、太过于偏爱投篮好的球员,但比起NBA原先推行过的EFF制度——简单粗暴的得分+篮板+助攻+盖帽+抢断-犯规-失误的算法,要靠谱得多。

随着霍林格先生在ESPN长期从事专栏写作和篮球研究的工作,数据热在网络上如火如荼。hoopdata网站更进一步,开始提供每个球员的投篮细节、传球去向等等。

那么这有什么用呢?举个最“口水”的例子吧,科比和詹姆斯谁强?

当我们打开投篮分布表,能够发现2009-2010赛季詹姆斯每场在篮圈附近的命中率达到73%,但是在3-9英尺的近距离只有54%;10到15英尺的中距离投篮为32%;16到23英尺的长距离中投为40%。

科比在篮筐周围的命中率只有59%,但在3到9英尺的近距离是46%;10到15英尺的中近距离投篮为50%。所以可以说科比的中投比勒布朗更出色、投篮范围更大——至少在2009-2010季是如此。

数据的确不会说谎。但要精准说明一件事,需要足够多的数据而已。

比赛后的热点图。

今后的数据,精确到分毫

21世纪,细节化数据越来越多地被融入球队管理。

比如,火箭的经理达雷尔·莫雷就是个数据狂,他有一套自己独立的数据体系来判断球员好坏,也就是这套体系,会把看似数据不出色的巴蒂尔描述成一个出色的团队球员。

比球迷和经理更痴迷数据的,是遍布美国、给天才们塞名片的球探们。他们需要更多更完备的数据,以便更好地评估一个球员。

终于,Synergy Sports出现了。这机构早在1998年由凤凰城太阳前教练加里克·巴尔创立,如今已经扩展到NBA30支球队都使用其产品,来对球员进行细节描述。这可能是最细致但也最琐碎的球员数据评估机构了。

比如到了2022年,你可能将听到:

凯文·杜兰特本场上场42分钟25秒,具体分布为,第一节开场至结尾,第二节余9分1秒时上场至半场结束,第三节开场至结尾,第四节余9分34秒时上场至第四节结束。

合计出手21次,为队友做掩护合计18次,包括6次原地对球掩护、8次无球掩护、4次假掩护……其中挡人有效7次,无效10次,犯规1次……

篮板球7个,其中前场篮板球2个,起跳抓到6个,其中2个前场篮板都是起跳后抓到;

合计拍球102下,其中运球过腰77下,运球在腰下25下,运球在膝高度8下……

合计跑动距离为XXX米,其中踱步距离为XXX米,半速跑动距离为XXX米,全速跑动距离为XXX米。加速弧线跑距离为……

到时候,你点开一个篮球论坛,将听到的不再是“我不喜欢约翰·沃尔的原因是,他的投篮技巧还不过关,他的对球防守也还太倾向赌博”。而将是大堆的数据:

“沃尔上一场的投篮选择如下:运球一步后投篮6次,未摆脱中投5次,其中4次在23英尺之外。而在他防守时,为了断球不惜4次让身体倾斜重心超过30度,他的防守前步与对手肩膀平行线之间的距离有6次超过警戒线……”

    澎湃新闻报料:021-962866
    澎湃新闻,未经授权不得转载
    +1
    收藏
    我要举报

            扫码下载澎湃新闻客户端

            沪ICP备14003370号

            沪公网安备31010602000299号

            互联网新闻信息服务许可证:31120170006

            增值电信业务经营许可证:沪B2-2017116

            © 2014-2024 上海东方报业有限公司

            反馈