传说中的神奇数据 ――PER解析

作者: tiyn  来自: hoopCHINA  2005-10-31

传说中的神奇数据 ――PER解析

      马龙和邓肯究竟谁更好?
      这个不难?那么小麦和小斯谁更好?
      甚至,小艾和巴克利谁更好?刺客和司机谁更好?
      ……
       没法比较。真的没法比较吗?

      现在不需要伤脑筋了,因为有这样一个数据,号称是将球员所有表现记录下来(sums up all a player's positive accomplishments, subtracts the negative accomplishments),然后加权集成,综合而成,可以对不同位置、不同年代的球员进行比较。

      这就是传说中的PER(The Player Efficiency Rating)。由John Hollinger提出,每年都统计到《Pro Basketball Forecast》这本书里面,售价$24.99……嗯嗯……咋就像广告捏。

      废话不说了,本帖就是要对PER数据进行粗略分析,看看它究竟神在何处。另外,拉出多位偶像球员进行PER的比较,大家自己去认领。

      另外,按照hoop规矩,首先列出参考链接,供大家取阅。
http://www.basketball-reference.com/
http://www.basketball-reference.com/about/glossary.html
http://www.basketball-reference.com/about/per.html
http://www.basketball-reference.com/labs/apbr.html
============引言结束,PER算法分析开始==============

      咱们先来看看PER是如何计算出来的。鉴于算法繁琐,共计有十二项,涉及到几十个基本数据,心理承受能力不强的兄弟务必在监护人陪同下观看。

第一步是计算 uPER (unadjusted PER),姑且叫做准PER吧。

先来看看uPER计算公式:
uPER = (1/MP)*
      [ 3P
      + (2/3)*AST
      + (2 - factor*(tmAST/tmFG))*FG
      + (FT*0.5*(1 + (1 - (tmAST/tmFG)) + (2/3)*(tmAST/tmFG)))
      - VOP*TO
      - VOP*DRBP*(FGA - FG)
      - VOP*0.44*(0.44 + (0.56*DRBP))*(FTA - FT)
      + VOP*(1 - DRBP)*(TRB - ORB)
      + VOP*DRBP*ORB
      + VOP*STL
      + VOP*DRBP*BLK
      - (PF*((lgFT/lgPF) - 0.44*(lgFTA/lgPF)*VOP))) ]

      来人,把晕到的筒子拖出去——喂狗。那几个呕吐的没关系,吐啊吐啊就习惯了。呵呵,下面分步解释。

―――――――――――――――总公式分隔线――――――――――――――――

先看总分母

MP,表示球员出场时间。用作总分母说明了PER的per-minute性质。

不是数据越高越好,而是效率越高越好

―――――――――――――――总分母分隔线――――――――――――――――

再看分子,逐项分析。

第一项:3P
3P,球员3分球命中数。
第一项衡量球员远投能力,不多说。

第二项:(2/3)*AST
AST,助攻。之所以用2/3乘,我想是为了表示助攻效果相当于三分球的2/3,那么助攻三分该如何计算呢?此处想不通。
第二项衡量球员在助攻上的贡献。

第三项:(2 - factor*(tmAST/tmFG))*FG

      先说说factor。factor = (2/3) - (0.5*(lgAST / lgFG)) / (2*(lgFG / lgFT))
lgAST / lgFG,联盟助攻数/联盟命中数;lgFG / lgFT,联盟命中数/联盟出手数

      由此看来factor应该是一个联盟数据,与球员个人表现无关。由公式可以看到,命中率越高,factor数值越大;出手次数越多,factor数值越小,同时也应该注意到,助攻次数越多,factor数值越小。显然Factor衡量的是联盟的运动战得分能力并突出了单打能力。

      再看整个项,tmAST/tmFG,球队助攻总数/球队命中总数;FG,球员命中数;

      联盟得分越容易,球队整体战越好(助攻数越多),该项数值越小;球队命中次数越多,球员命中次数越多,该项数值越大。
因此感觉第三项是衡量球员的运动战得分能力。并且根据联盟防守情况和球队整体以及球员单打能力作了修正:联盟防守质量越强越值钱,球队整体越强越不值钱,球员单打越强越值钱。

第四项:(FT*0.5*(1 + (1 - (tmAST/tmFG)) + (2/3)*(tmAST/tmFG)))

      FT,球员罚中数;tmAST/tmFG,球队助攻数/球队命中数

      第一感觉就是公式有问题,因为该公式居然不是最简状态,可以合并同类项,化简得:
FT*0.5*(2 - (1/3) *(tmAST/tmFG))
由化简后公式看,球员罚中越多,数值越大,球队整体战越强(得分主要依赖于助攻,罚球机会少),数值越小。这是合乎逻辑的。

      但是我个人认为,把公式改成(FT*0.5*(1 + (1 - (tmAST/tmFG)) + (2/3)*(lgAST/lgFG)))更合理一些。这样就考虑到了联盟的影响,如果联盟罚球普遍偏多,那么球员的罚球贡献就会贬值。
这会不会是作者的笔误捏?个人看法,欢迎探讨。

      第四项是衡量球员罚球上的贡献。

第五项:-VOP*TO

      先说说VOP,VOP= lgPTS / (lgFGA - lgORB + lgTO + 0.44*lgFTA)
LgPTS,联盟平均得分;lgFGA,联盟平均出手;lgORB,联盟平均前板;lgTO,联盟平均失误;lgFTA,联盟平均罚球数;由此可见VOP衡量的是联盟每一次进攻的平均效率。

      TO,球员失误。

      第五项用来计算球员失误的,前面加负号表示因为失误造成球队的失分。

第六项:- VOP*DRBP*(FGA - FG)

      先说说DRBP,DRBP = (lgTRB - lgORB) / lgTRB
LgTRB,联盟平均总板;lgORB联盟平均前板;由此可见,DRBP衡量联盟整体防守篮板能力。(包括后板和球队篮板)

      VOP,联盟进攻平均效率;FGA,球员出手数;FG,投中数。

      第六项应该是衡量球员浪费投篮机会的能力。前面加负号表示因为球员投篮失手造成球队的失分。

第七项:- VOP*0.44*(0.44 + (0.56*DRBP))*(FTA - FT)
      VOP,联盟进攻平均效率;DRBP,联盟平均防守篮板;FTA,球员罚球数;FT,罚中数。
      第七项衡量球员浪费罚球机会的能力。前面加负号表示因为球员投篮失手造成球队的失分。

第八项: VOP*(1 - DRBP)*(TRB - ORB)
      VOP,联盟进攻平均效率;DRBP,联盟平均防守篮板;TRB,球员总板;ORB,球员前板;
      第八项应该是衡量球员后板能力,但是为什么不直接用后板捏?搞不清楚。用联盟防守篮板作了修正,联盟防守篮板整体能力越强就越不值钱。

第九项:VOP*DRBP*ORB
      VOP,联盟进攻平均效率;DRBP,联盟平均防守篮板;ORB,球员前板;
      第九项应该是衡量球员前板能力。用联盟防守篮板作了修正,联盟防守篮板整体能力越强就越值钱,真是科学啊。

第十项:VOP*STL
      VOP,联盟进攻平均效率;STL,球员抢断。
      第十项衡量球员抢断能力。

第十一项:VOP*DRBP*BLK
      VOP,联盟进攻平均效率;DRBP,联盟平均防守篮板;BLK,球员盖帽。
      第十一项衡量球员盖帽能力。但有一个疑问是,为什么用联盟防守篮板能力捏,应该用球队防守篮板能力才合理亚。

第十二项:- (PF*((lgFT/lgPF) - 0.44*(lgFTA/lgPF)*VOP)))

      PF,球员犯规;lgFT/lgPF,联盟平均罚分/联盟平均犯规;lgFTA/lgPF,,联盟平均罚球数/联盟平均犯规;VOP,联盟每一次进攻平均效率

      联盟罚球越准,犯规损失越大;联盟进攻效率越高,犯规损失越小;联盟犯规数越多,大家都犯规,那么犯规损失相对越小。

      第十二项衡量球员犯规带来的损失。

―――――――――――――uPER结束,aPER开始――――――――――――――

      好了,这个搞完后,只是一个uPER,还需要加以修正。计算aPER (adjusted PER)——修正PER。

计算公式:
aPER = (pace adjustment)*uPER
pace adjustment = lgPace / tmPace
pace = 48 * ((Tm Poss+Opp Poss) / (2*(Tm Mp / 5))
poss = FT+0.44 FM—TmORB+TmTO。

      从下往上看一步步分析:

先来看Poss的计算。poss = FT+0.44 FM—TmORB+TmTO
FT,球队出手数;FM,罚球数;TmORB,球队前板数;TmTO球队失误数
因此,Poss此处的含义是球队进攻次数。

再来看Pace。pace = 48 * ((Tm Poss+Opp Poss) / (2*(Tm Mp / 5))
Tm Poss,我方进攻次数;Opp Poss,对方进攻次数;Tm Mp我方比赛时间(一般是48分钟,有时候含加时)
因此,Pace含义是48分钟内球队和对手的进攻次数

再来看pace adjustment。pace adjustment = lgPace / tmPace
lgPace,联盟场均回合数;tmPace,球队场均回合数。
如果球队属于群魔乱舞型,比如太阳小牛,数值就会低。如果球队属于慢火炖汤型,数据就会高。
因此,Pace adjustment含义是球队打法快慢的修正系数。

最后看aPER
aPER = (pace adjustment)*uPER
很简单了,aPER旨在消除球队打法快慢对数据带来的影响。太阳队进攻流畅,活塞队阵地攻坚,如果以时间作为计量单位,两者的数据是无法相比的,华丽的球队数据必然也会华丽。但是如果以回合为计量单位,这两种球队的数据就会变得相同。其实太阳队会吃亏,因为流畅显得略微欠考虑。

―――――――――――――aPER结束, PER开始――――――――――――――

真正的PER
       PER = aPER*(15/aPERlg)。

      用意是再一次消除联盟的影响。如果球员所处时期联盟防守松懈,比如张大帅时代,球员数据暴涨,那么这项计算就会使得数据相应贬值。

      成功了,功德圆满。您能有毅力坚持看到这里,向您致敬。然后一起向Mr ollinger致敬。

=============PER算法结束,评价开始===============

先说说优点。
比较全面。虽然没有内外线得分分配、得分时间段分配、被盖率等变态数据,但是在算法中也基本囊括了所有有效的记录数据,而且说实话那些变态数据对于衡量球员的总体表现并不是很重要。

很多修正。
注重突出单打,使得数据与印象更为吻合;将助攻、抢断、篮板等各种表现加权修正,使得不同数据之间可以衡量,由此也使得不同位置的球员可以衡量;将球队的不同打法进行修正,使得老爷车型球队和快打型球队之间可以衡量;将整个联盟情况进行修正,使得不同时代球员之间可以衡量。

再来说说缺点。

有些表现有遗漏。对防守的衡量不充分,之停留在帽板断的程度,当然这与整个NBA数据重功轻守有关系。内线的卡位肉搏没有体现,外线的死缠没有体现,而且外线板帽弱,吃亏更大。如果一名球员不作盯人防守,只去捞篮板盖帽等数据,PER将会很高。
很多抽象的东西没有体现。比如领袖全队、霸气、硬朗度等等。而这个不仅在印象中很重要的,而且在决定比赛胜负中也很重要。

有些想法不科学。注重突出个人能力,整体型打法的球员将会吃亏,比如大鸟。实际上我认为善于依靠整体也是球员的能力体现,而且我坚持认为这样的球员更聪明,即使这样说会怠慢帮主。

根据缺点对PER进行修正

      给防守型球员加分,给外线队员加分,(所以鲍叔应该加双重分。)给整体型球员加分,根据球员领袖地位、霸气、硬朗度适当加分。(领袖气质建议用Usg数据衡量,霸气建议用关键时刻PER衡量,硬朗度建议用内线得分、犯规量、篮板和防守质量来衡量。)

========PER评价结束,偶像比较开始,请大家认领============

      由于有些数据是七八十年代才开始记录的,所以大帅那个时代就不分析了,只捡了近二十年来的人气偶像。一共收集了41位高人的数据,按照最高赛季PER数据进行排名。需要强调的是该排名不包括所有球员,仅仅是41人之间排座次。

1. 帮主 最高赛季:31.71,88年;生涯:29.06(神。奇才两年没算,俺偏心俺承认)
2. 上将 最高赛季:30.66,94年;生涯:26.18(考虑到硬朗程度应减分)
3. 奥胖 最高赛季:30.64,00年;生涯:28.01(半神)
4. 小麦 最高赛季:30.27,03年;生涯:24.14(恐怖,虽然考虑到防守要减分)
5. 狼王 最高赛季:29.44,04年;生涯:23.51(同上将)
6. 巴胖 最高赛季:28.96,91年;生涯:24.63(可惜不稳定,防守略差)
7. 马龙 最高赛季:28.90,97年;生涯:23.86(注意最高赛季年份,不愧无冕之王)
8. 大鸟 最高赛季:27.77,88年;生涯:23.50(头脑,头脑啊)
9. 大梦 最高赛季:27.31,93年;生涯:23.58(遇弱不强,遇强更强)
10.邓肯 最高赛季:27.06,04年;生涯:25.31(如果不考虑戒指,他确实比不上马龙)
11.魔术 最高赛季:27.03,87年;生涯:24.12(如果他更专注一些会更好)
12.小斯 最高赛季:26.64,05年;生涯:21.19(本季足够名垂青史但需更多赛季证明)
13.科比 最高赛季:26.17,03年;生涯:22.45(有28+的实力,加油吧)
14.司机 最高赛季:26.07,05年;生涯:22.60(一世英名毁于季后,明年再来)
15.尤因 最高赛季:25.80,90年;生涯:21.01(看来与大梦上将确实有差距)
16.莫宁 最高赛季:25.75,00年;生涯:21.74(如果不换肾,估计能到26+)
17.小詹 最高赛季:25.67,05年;生涯:22.15(数据华丽,为啥PER偏低捏?)
18.希尔 最高赛季:25.54,97年;生涯:21.92(伤病啊,起码能28+,太可惜)
19.韦伯 最高赛季:24.64,01年;生涯:21.62(天赋超群,在国王涅槃成一流大前)
20.电影 最高赛季:24.62,90年;生涯:22.20(美好的回忆)
21.便士 最高赛季:24.58,96年;生涯:17.54(同希尔)
22.德雷 最高赛季:24.07,88年;生涯:21.33(比起帮主,差距还是不小的)
23.斯托 最高赛季:23.89,90年;生涯:21.80(恐怕还得加分,尊敬)
23.小艾 最高赛季:23.89,01年;生涯:21.14(身材所限,钦佩他的勇敢)
25.凯文 最高赛季:23.74,91年;生涯:20.71(谁还记得太阳凯文?被严重低估)
26.手套 最高赛季:23.59,00年;生涯:19.66(也尊敬他,感觉他如同小艾)
27.卡特 最高赛季:23.36,00年;生涯:22.12(适当增强防守,争取25+)
28.明明 最高赛季:23.18,05年;生涯:21.89(成绩不差,努力啊,争取25+)
29.皮二 最高赛季:23.14,94年;生涯:18.63(也许有25+的实力,但没有表现)
30.韦德 最高赛季:23.13,05年;生涯:20.83(加油吧,期待28+)
31.雨人 最高赛季:22.88,94年;生涯:19.08(作为大前,好像并不是特别突出)
32.普莱 最高赛季:22.70,94年;生涯:19.62(印象中类似于科尔,看来被低估了)
33.皮斯 最高赛季:22.69,03年;生涯:21.25(皮皮还有潜力可挖么?)
34.老马 最高赛季:22.66,01年;生涯:19.68(至少01年是第一控位)
35.纳什 最高赛季:22.59,03年;生涯:18.87(居然不是今年最高,加油!)
36.曼努 最高赛季:22.29,05年;生涯:18.99(争取25+,接大鸟的班,努力吧)
37.刺客 最高赛季:22.19,85年;生涯:18.11(外线防守被忽视的结果)
38.基德 最高赛季:22.18,03年;生涯:18.77(与印象不符,防守被忽视投篮又太差)
39.弗大 最高赛季:21.61,01年;生涯:19.09(还是有差距的,他数据挺华丽的亚)
40.小奥 最高赛季:21.37,03年;生涯:18.88(本赛季最高可惜出场时间不够,无视)
41.米勒 最高赛季:21.06,94年;生涯:18.35(特点鲜明的球员往往会被我们高估)

感觉上可以这样划分:
内线:30+,变态;27+,超一流;25+,一流。
外线:30+,极度变态;27+,变态;25+,超一流;22+,一流。
控卫:25+,变态;23+,超一流;21+,一流。

浏览相关文章:
无相关信息