关于比较球员的探讨——当今数据泰斗Dean Oliver理论解析
作者: tiyn 来自: hoopCHINA 2005-10-31
这篇文章结论是次要的,关键之处是当世第一数据泰斗Oliver流露出来的数据理论、比较思路和数据采集角度,可以让我们打很多冷战,相应的我们也可以采集同样的数据比较某些我们感兴趣的球员。比如科麦、姚斯、马佛、司狼……比较的结果附在帖子最后,按照他的思路,对帮主的定位似乎也不准确,看来Oliver大人的数据理论,嘿嘿,似乎也是难以自圆其说。
本帖共分三大部分,第一部分是摘要介绍作者的文章,解析Oliver数据理论;第二部分是针对该理论的一些意见;第三部分是众偶像球员的比较。
相关链接:
http://www.rawbw.com/~deano/articles/JordanvsOlaj.html
http://www.basketball-reference.com/about/glossary.html
所有数据均取自basketball-reference。
帖子很深,对数据计算没有兴趣的筒子可以直飞第三部分认领偶像,以免路上晕车。
==============Oliver数据理论解析之个人胜率PW%==============
一、衡量球员的重要数据——球员个人胜率
乔丹 大梦
赛季 胜场PW 负场Pl 胜率PW% 胜场PW 负场Pl 胜率PW%
'87 17.0 2.4 0.877 12.3 2.2 0.850
'88 19.4 0.7 0.967 11.9 2.1 0.850
'89 18.0 0.7 0.961 14.9 1.7 0.898
'90 18.0 1.1 0.942 14.2 1.8 0.888
'91 17.5 0.4 0.980 9.3 0.5 0.945
'92 15.9 0.6 0.966 10.6 1.5 0.873
'93 17.0 0.8 0.953 17.3 0.8 0.957
'94 16.8 1.1 0.937
'95 2.8 0.9 0.757 14.0 2.3 0.859
'96 15.8 0.8 0.953 11.4 4.5 0.718
'97 14.3 1.3 0.918 10.8 4.6 0.701
'98 14.2 2.3 0.861 5.3 3.1 0.629
帮主完全领先(除95年复出),优势不算很明显,仅有5%。但Oliver说5%已经足以致命:如果是球队胜率,0.944的球队击败0.894球队的概率是66.7%。如果是个人胜率,他说他没法统计,倒…。而且,还有更多的数据表明,乔丹对球队的贡献超过大梦。我估计他的意思是乔丹占据的Poss在球队中的比例高于大梦。(胜负场次为啥有小数?占据Poss是啥意思?后面都有详细解释,够喝一壶的。)
二、个人胜率计算方法
乔丹 大梦
赛季 ORtg DRtg ORtg DRtg
'87 116.5 103.4 106.4 95.8
'88 123.2 100.4 105.4 94.9
'89 122.5 100.8 104.2 91.4
'90 122.5 103.5 101.9 89.9
'91 126.0 99.6 106.0 89.2
'92 121.8 99.4 106.7 94.9
'93 120.2 100.2 111.2 92.2
'94 107.8 91.5
'95 107.6 100.4 107.5 96.4
'96 123.5 99.6 107.7 100.7
'97 121.1 101.9 105.1 98.9
'98 113.6 99.8 104.9 101.3
上面的数据是两人的ORtg和DRtg,也就是进攻效率和防守效率。进攻效率越高越好,防守效率越低越好。这两个数据是个人胜率的计算基础。
显然,乔丹是攻击性球员,而大梦的防守更强。虽然帮主入选最佳防守阵容的次数多于大梦,但Oliver认为,与外线相比,内线处于防守最核心位置,在防守上具有天然的优势,(这点我非常赞同),防守阵容的评选无法体现所属位置的因素。
有了进攻效率和防守效率,如何计算球员胜率呢?
首先计算球员的参与比赛有效场次PGm
Oliver提出了一个Possession的概念,姑且翻译为进攻过程。在他的眼里,球场上的任何时间都是由一个个Possession组成的。什么…你说防守?当然是Opp Possession(对方进攻过程)啦,笨…。
Possession的概念解释
Possession的意义重大,这个概念使得球员在场上行为的价值可以互相衡量。(类似于等价流通物——钞票,谁占据更多Poss谁就相当于拥有更多钞票,嘿嘿。)
想必大家还记得前几年的集锦,公牛由大虫抢得后板获得球权,第一时间传给皮二,皮二带球到前场,助攻帮主,帮主轻松扣篮两分结束。这是一个典型的Possession,该进攻过程中参与的共有皮二和帮主两人。(你说我无视大虫?No,抢后场篮板不属于Possession,而是属于Opp Possession。明白?)
既然Possession属于皮二和帮主两人,问题出来了,究竟如何分配?换句话说皮二的助攻价值多少Possession?Oliver认为这取决于看助攻的质量。他举了这样的例子,如果奥胖篮下要位成功,科比助攻过去,那么该Possession一人一半;如果奥胖在三分线外,科比助攻奥胖三分投中,那么该Possession基本上全属于奥胖。(科比:不公平…。奥胖:丫的你那是想造我24秒吧!)那么回到帮主和皮二,很显然,该Possession是军功章啊有你的一半也有我的一半。
总起来说,Oliver计算出来,助攻的价值相当于0.25个Possession。那进攻篮板的价值呢?如果进攻篮板不另算Possession,那么一个进攻篮板价值0.1个Possession。(汗,这句话能看懂么?)
其它的,球员在场上所有有记载的行为(比如助攻、盖帽、失误、抢断等等)都可以换算成Possession&Opp Possession,就可以统一比较啦。(鲍叔:那俺粘着人没有记载咋办?Oliver:看见你这种人就烦!你丫的就不能换换打法么?)
从上面可以看出来,球队的五名队员中,并不是所有球员都占据Possession&Opp Possession的。在Oliver眼中,这些球员仅仅是在做折返跑,(可怜的鲍叔,汗…。)这种算法有些误差,在Opp Possession中亏待了鲍叔,在Possession中明显亏待了咱们家明明(明明:俺恁么辛苦的拉出来掩护图个啥呀。)
有效场次PGm的概念解释
既然球员有做折返跑的时间,那么实际上没有一名球员能够真正有效的打满全场,那怕他出场时间场均48.5min。(大帅:…这是说谁呢?)Oliver剔除掉球员折返跑部分,提出了球员PGm(有效场次)的概念。
有效场次只计算球员占据的Possession&Opp Possession,毫无疑问,有效场次远远小于球员参加的比赛场次。球员越是核心,越能够占据更多的Possessions,有效场次也就越多。(现在知道为什么帮主和大梦的场次有小数了吧。)
有效场次PGm公式和简略解释
PGm=
TmG*
球队总比赛场数
((3*(Poss / Tm Poss)
球员占据Possessions在球队中的比例
+ 3*(Stops / Tm Stops)
球员占据Opp Possession在球队中的比例(Stops的具体含义后面再讨论)
+ (MP / Tm MP)) / 7)
这是球员出场时间在球队中的比例(此处可以修正鲍叔,但还是远远不够)
然后计算球员胜率PW%
作者证明,可以通过比较球队的进攻效率和防守效率准确判断(不是预测)球队胜负。如果球队进攻效率高于防守效率,球队胜,反之则负。这个结论可以引申到到球员,如果该球员比赛的进攻效率高于防守效率,球员胜,反之则负。但实际上由于是按照有效场次的计算,所以无法对球员作类似球队的胜率计算,解决的办法是通过进攻效率和防守效率来计算。
球员胜率PW%公式和简略解释
PW%= ORtg14 /(ORtg14+DRtg14)
感觉上这更像个经验公式,14次方的作用貌似是为了拉开差距,因为球员之间防守效率太接近了
可以计算球员胜场PW&负场PL
PW= PGm *PW%
PL= PGm -PW
使用球员个人胜率来衡量球员的表示是否科学呢?恐怕目前还不能下结论,因为我们还不明白球员个人胜率的计算基础——进攻效率和防守效率——的算法。(鲍叔:什么?光计算Possessions我就吃大亏啦,还要算上进攻效率和防守效率…)
下一步就来看看两个效率是如何计算的。
===============Oliver数据理论解析之进攻效率ORtg=============
三、进攻效率
进攻效率就是球员在100次进攻过程中所能够产生的得分。包括直接得分、助攻还有进攻篮板所导致的得分。因此,进攻效率的计算基础是投篮、罚球、助攻、进攻篮板。
作者承认遗漏了另外一些重要的因素,比如掩护和某些间接助攻,但作者认为进攻中的因素已经基本具备,这些遗漏无关大局,倘若一个人的长处只是在场上作掩护或者间接助攻,那么他当然很吃亏,但事实上不可能有那样的球员存在。(就好像电脑的使用说明书上没有说明不可以做电磁炉别人也不可能用电脑做饭一样)
首先计算球员产生的得分PProd (Points Produced)
计算思路是首先把投篮、罚球、助攻、进攻篮板转换成Possessions,然后再用两分或三分去乘就行啦。
球员产生得分PProd公式并附简略解释:
Points Produced
={2*[(FGM+0.5*3ptFGM)
球员自身两分球和三分球命中直接产生的得分
+ASTFIG*AST*( (TMFG-3ptFGM)/(TMFG-TM3ptFGM) )
球员通过助攻队友所产生的得分
-ASTFIG*(FGM+0.5*3ptFGM)* ( (TMAST/TMMIN*5*Min-AST)/(TMFG/TMMIN*5*Min-AST) )]
扣掉球员被队友助攻所得到的部分分数(因其中有助攻队友的功劳)
+0.4*FTA*(2*FT%2+2*FT%*(1-FT%))+qmk*FTM}
罚球所产生的分数
*(1-(TMFloor%-TMPlay%)*ORFIG)
减去由于进攻篮板所误算的得分(误算原因是抢到进攻篮板后,并不都是自抢自投)
+ORFIG*TMPlay%*OR*TMPtsPerScPoss
加上由于抢到进攻篮板间接产生的分数
qmk = 0.06
技术犯规、打三分等非常规罚球的修正值
TMPtsPerScPoss = Team Points/(FG+0.4*FTA*(1-(1-FT%)2))
球队每次进攻机会所能够得到的平均分数
这仅仅是球员所产生的得分,进攻效率是球员100次进攻所产生的得分。所以,下一步就是
其次计算球员占用的进攻过程Possessions
包含以得分为结束的进攻和以不得分为结束的进攻两种。
公式并附简略解释:
Possessions =
Scoring Possessions
以得分为结束的进攻,具体公式解释附后
+ FGA-FG
以投篮不中为结束的进攻
- (FGA-FG)*(TMOR/(TMOR+Opp.DR))
剔除因抢到进攻篮板而延续的进攻过程(因为进攻篮板不另算过程)
+ (1-FT%)2*0.4*FTA
以罚球不中为结束的进攻
+ TO
以失误为结束的进攻(含进攻犯规、违例、被盗、传球失误等情况)
我们再来看看所有以得分为结束的进攻Scoring Possessions
Scoring Possessions
=[FG
以投中为结束的进攻(含两分三分,含被被队友助攻)
+ASTFIG*AST
以球员助攻队友得分而结束的进攻
-ASTFIG*FG*( (TMAST/TMMIN*5*Min-AST)/(TMFG/TMMIN*5*Min-AST) )当球员被队友助攻时,剔除该助攻队友所占据的进攻过程
+(1-(1-FT%)2)*0.4*FTA]
以球员罚球得分而结束的进攻
*[1-ORFIG*(TMFloor%-TMPlay%)]
剔除由于进攻篮板而延续的进攻过程
+OR*TMPlay%*ORFIG
由于进攻篮板而额外增加的进攻过程。(抢1个进攻篮板相当于占据0.1次进攻过程)
ORFIG=0.1
抢1个进攻篮板相当于占据0.1次进攻过程
TMFloor%={(FG+(1-(1-FT%)2)*0.4*FTA)/Possessions}_Tm
如果进攻篮板不算另一次进攻,球队在场上能够得分的进攻过程占总进攻过程的比例(类似于得分成功率)
TMPlay%={(FG+(1-(1-FT%)2)*0.4*FTA)/(Possessions + OR)}_Tm
如果进攻篮板另算一次进攻,球队在场上能够得分的进攻过程占总进攻过程的比例(同上,但数值要低些)
最后计算球员进攻效率Offensive Ratings
这就很简单了,进攻效率就是球员占据100次过程所产生的得分
Offensive Ratings=PProd*100/ Possessions
===============Oliver数据理论解析之防守效率DRtg=============
四、防守效率
防守是最令数据男头疼的问题,并不是因为计算复杂,恰恰是因为计算过于简单。相比较进攻,防守方面数据匮乏,导致数据量化准确性远远低于进攻。
Oliver设计了衡量球员防守表现的思路,创造了一套公式计算防守效率。但他自己也承认该数据无法评价杜马斯鲍叔之类的球员,但是该效率却能够很好的评价球队整体的防守。(杜马斯鲍叔,原谅Oliver吧,他已经尽力了。要么,你们还是换个打法吧。)
首先计算阻攻Stops
公式和简略解释:
Defensive Stops =
Min*[(OppFGA-OppFGM-OppOR-TMBLK)/2
对方受到干扰投失的统计(这是球队整体的功劳,鲍叔的奉献还是有所体现的)
+(OppTO-TMSTL)]/TMMIN
对方受到干扰自己失误或被盗的统计(这也是球队整体的功劳)
+ STL + 0.5*(DR+BLK)
球员盗球和防守篮板和盖帽的统计(这才是球员自己的防守表现,鲍叔的差距在这里)
然后计算球员在球队防守体系中的地位
Stops/Poss= Stops*TMMIN/Min*TMPoss.
最后计算球员防守效率Defensive Ratings
Def. Rtg =
0.8*TMDef.Rtg
球队防守的成绩
+ 0.2*(200*(1-stops/poss))
在对方100次进攻过程中,个人防守的成绩。由于前面是负号,所以防守效率越小越好
=================针对Oliver数据理论的意见===============
令人惊艳的Possessions
这个概念是Oliver整个数据分析理论的基础,Possessions使得球员在场上的所有数据之间都可以相互比较。
受到当今数据采集水平所限,Possessions的缺点是不够细致。在进攻中无法反映球员的掩护、扯动、间接助攻的情况,在防守中无法反映盯人防守等情况。
严密的进攻效率ORtg
ORtg基本上能够反映球员的进攻表现。感觉上是把助攻、进攻篮板也转换成得分,然后加上投篮和罚球一起算命中率。球员命中率对进攻效率的影响是关键的,球员的前场篮板和助攻数量对进攻效率的影响也很大。
由于计算基础Possessions本身缺陷,ORtg也需要修正。类似于明明这种喜欢掩护的,奥胖这种能够吸引火力的……都应该适当加分。
另外,进攻效率是与球员承担的进攻任务的强度密不可分的。一般说来,球员担负进攻任务强度越高(反映在数据上就是占据Possessions越多),球员的进攻数据就会越华丽。但我们发现,当强度达到一个临界点的时候,球员进攻效率就会开始显著下降。
顺便说一句,我发现帮主在高强度下保持高进攻效率的能力是无敌的。
模糊的防守效率DRtg
相比较ORtg,DRtg就模糊多了。需要修正的地方也多。
由于计算基础Possessions本身缺陷,DRtg无法反映粘人防守的情况,所以鲍叔这种球员需要加分。
由于板帽的计算,外线防守被削弱,内线防守被放大。因此需要给外线球员加分。尤其是帮主、阿泰这种入选过最佳防守阵容的外线。
DRtg中球队整体防守比例大,因此诞生在防守强队的球员,天生就会拥有很高的防守效率。而一些防守弱队的球员,就算本身表现很好也容易被球队拖累。比如科比由04年的102暴增到05年的111。显然,那些奋斗在防守弱队的球员应该适当加分。(从这个角度上说,鲍叔比起小艾来,也是占很大便宜的。)
冷眼旁观球员个人胜率PW%
球员胜率PW%的计算基础是ORtg&DRtg,综上叔叔,谁该加分,谁该减分就很清楚了。
=====================偶像认领专区=================
现在看看偶像们的表现排名。选取数据依次是单赛季最佳成绩,赛季年份,生涯最佳成绩。
由于前面说到,进攻效率需要结合球员任务强度,所以我又找到了Usg。其实应该找球员占据过程在全队的比例比较合适,但可惜无法找到,自己又懒得计算,就用Usg代替。这种代替使进攻节奏快的球队占便宜(比如小斯)。
Usg含义:球员在40钟的时间内,占据的进攻过程Possessions的数量,反映球员担负进攻任务的强度。
按照单赛季个人胜率PW%排名
PW% ORtg DRtg Usg
1. 上将:96.4,’96,93.1; 120,’96,116; 92,’00, 96; 31.0,’94,24.8;
2. 乔丹:95.8,’96,82.7; 125,’91,118; 100,’96,103; 40.4,’86,33.3;
3. 斯托:94.5,’88,87.6; 125,’97,121; 98,’99,104; 24.8,’90,21.8;
4. 狼王:94.4,’04,76.9; 117,’05,110; 92,’04, 99; 27.1,’04,23.9;
5. 奥胖:94.0,’00,84.1; 120,’94,114; 95,’00,100; 30.1,’96,28.3;
6. 巴胖:93.8,’90,85.2; 128,’90,119; 100,’99,104; 28.9,’91,24.8;
7. 邓肯:93.7,’04,89.4; 114,’02,110; 89,’04, 94; 27.2,’04,25.8;
8. 贾巴:93.2,’78,81.2; 120,’85,115; 94,’78,102; 29.4,’78,25.3;
9. 摩西:92.9,’82,74.9; 117,’92,114; 97,’83,105; 30.8,’82,26.3;
10.曼努:92.9,’05,86.7; 117,’05,111; 93,’04, 96; 22.3,’05,19.0;
11.魔术:92.0,’89,87.7; 126,’90,121; 98,’81,104; 30.2,’86,25.7;
12.司机:91.8,’90,82.1; 120,’02,116; 98,’03,102; 26.2,’05,26.8;
13.大梦:91.3,’93,98.6; 114,’93,108; 93,’90, 98; 29.2,’96,26.1;
14.大鸟:91.0,’86,82.7; 121,’88,115; 98,’83,101; 30.8,’88,28.1;
15.马龙:90.1,’97,79.7; 120,’92,113; 96,’99,101; 31.7,’90,28.2;
16.博士:89.8,’81,74.5; 117,’82,111; 97,’81,101; 32.1,’80,28.4;
17.莫宁:89.3,’00,75.8; 112,’00,108; 93,’01, 99; 27.1,’02,24.1;
18.尤因:88.9,’94,68.3; 115,’90,106; 91,’99, 99; 30.6,’91,26.7;
19.康熙:88.5,’05,67.8; 121,’05,113; 99,’04,106; 22.8,’04,20.9;
20.玛丽:88.3,’01,79.7; 116,’05,110; 94,’01, 99; 21.6,’02,20.4;
21.小斯:88.0,’05,66.1; 121,’05,110; 101,’03,103; 25.2,’05,22.9;
22.皮二:87.7,’96,67.4; 116,’96,108; 97,’94,101; 27.4,’94,22.8;
23.姚明:87.1,’05,84.9; 113,’05,111; 97,’04, 98; 23.6,’05,22.2;
24.便士:86.5,’96,57.2; 122,’96,108; 97,’99,105; 26.0,’98,21.9;
25.希尔:86.1,’97,68.2; 114,’97,110; 98,’99,103; 28.9,’00,25.8;
26.滑翔:85.5,’92,73.4; 119,’95,114; 103,’97,105; 29.8,’92,26.3;
27.科比:84.3,’00,68.8; 112,’04,111; 98,’00,104; 30.0,’05,27.8;
28.小麦:82.6,’03,67.6; 116,’03,110; 106,’00,110; 32.6,’03,28.0;
29.纳什:82.2,’05,69.0; 123,’05,117; 105,’98,109; 24.1,’03,20.7;
30.小詹:78.6,’05,57.3; 114,’05,107; 103,’05,104; 28.8,’05,27.9;
31.精华:75.4,’87,58.9; 118,’90,112; 99,’99,108; 35.7,’88,35.4;
32.卡特:75.4,’01,61.3; 114,’01,108; 102,’04,105; 29.6,’04,28.1;
33.弗大:74.9,’01,53.3; 113,’01,106; 99,’04,105; 27.0,’05,24.9;
34.刺客:73.1,’85,48.5; 115,’85,106; 104,’90,107; 29.7,’84,28.3;
35.小艾:70.4,’01,50.6; 109,’98,103; 99,’99,103; 35.4,’02,31.3;
36.韦德:70.2,’05,60.7; 109,’05,106; 102,’04,103; 29.0,’05,26.8;
37.马布:69.0,’05,48.7; 118,’05,108; 106,’03,109; 28.7,’01,26.1;
另外:
鲍叔:70.6,’05,49.5; 97,’04,102; 110,’03,101; 12.8,’98,11.4;
大家感觉如何?
控卫优势太大(因为助攻),内线优势太大(因为篮板),在这种情况下,帮主还能够名列前茅,不得不佩服。
我认为准确性不如PER。可以两者结合来看。
PER的解析在这里:http://www.hoopchina.com/bbs/htm_data/2/0509/48737.html
浏览相关文章:
无相关信息


