人才计划第四期毕业作品NBA雷霆队胜(雷霆队中文网)
温馨提示:这篇文章已超过900天没有更新,请注意相关的内容是否还可用!
今年7月6日,雷霆队与快船队达成交易,将保罗-乔治交易至快船。短短几天后,雷霆队又将威斯布鲁克送到火箭队。至此,雷霆队近几年来的核心阵容瓦解,基本宣告重建,使得本文的研究价值大打折扣,但研究 *** 仍然可以作为参考,推广至其他球队。
摘要NBA是当今世界上之一大篮球联盟,也是最全球化、影响力更大的职业体育组织之一。本文以NBA雷霆队为例,从教练的视角出发,试图寻找每场比赛胜负的影响因素,建立逻辑回归模型。结果表明,比赛地点、进攻选择、防守表现、球星状态均会在不同程度上对比赛结果造成一定的影响。本文的结论可以应用于战术指导及结果预测,为雷霆队的教练及管理层提供一定参考。
一、背景介绍NBA(美国职业篮球联赛)创办于1946年,经过70多年的不断发展,从最初的一个小小篮球联盟,到如今已经发展成为一个全球化的庞大体育产业帝国,在全世界拥有无数拥趸,几乎所有的篮球迷都在为这个联盟所疯狂。到目前为止,全球已有200余国家或地区转播NBA,超过五亿的粉丝观众收看,可见其受众之广。与此同时,无论是比赛季还是休赛季,都有着广大媒体、球迷在各个社交平台乐此不疲地讨论NBA,话题大到球队的发展方向,小到球员日常的趣事,可见其影响之大。凭借其独特的营销战略,NBA当之无愧地成为现如今世界上最成功的一个商业性联盟。
输赢是所有体育运动的魅力所在,胜利者凯旋而归,接受人们的欢呼赞叹,失利者黯然离开,为下一次的复仇继续苦练。篮球也不例外,在NBA中,最终获胜的队伍会捧起拉里·奥布莱恩冠军奖杯,球员们戴着独一无二的冠军戒指,开着香槟,在街头举行冠军 *** ,整座城市都会为他们狂欢。战绩好的球队自然收获有更多的观众,售卖更多的门票,对球队胜利贡献大的球员也能够签下更大的合同,赚取更高的薪水,可以说球队的战绩牵动了所有人。球队的战绩又是通过一场场比赛积累起来的,要想在一个赛季内最终胜出,就要把握好每场比赛的细节。一支球队每场比赛的胜负影响因素自然也就成为了球员、教练乃至整个球队管理层最关心的问题,如果能够找到影响胜负的关键因素,就可以帮助球队发挥优势、弥补不足,从而使战绩更上一层楼。所以,这个问题的研究极具实用性。
不同球队的胜负影响因素既存在着共性,也有很大差异。共性体现在每支球队都需要在比赛中尽可能多地得分、尽可能多地保护篮板球等等,而差异的存在更有研究价值。有的球队依赖于三分球,每场比赛都有着可观的出手数量,可见三分球命中率将会是影响胜负的关键因素。有的球队依靠球星带队,球星当天的表现成为了球队整体发挥的关键。有的球队素有魔鬼主场之称,但是往往到了客场就会频繁出现发挥失常的问题。所以说,每个球队的胜负影响因素“因队而异”,这也是已有相关研究通常以具体球队而不是联盟整体为目标进行分析的原因。
那么,一支球队能否获胜的影响因素有哪些呢?本文将从教练的视角进行研究,从而对于如何排兵布阵给出一定的启示。对于教练来说,球队能否获胜的影响因素可以分为直接因素和间接因素。直接因素与比赛的结果有着直接关联,比如比赛双方的得分、助攻、命中率等,对于比赛结果的影响很明显,但很难通过教练的安排所控制,很大程度上取决于当天球员的发挥,所以研究价值较低。间接因素是在一定程度上可以控制的因素,比如轮换人数、三分球出手数、罚球出手数等,反映了教练的战术安排,即多投三分球、多进内线造杀伤等。如果能找到更多影响比赛胜负的间接因素,将会对于教练有着很大的借鉴意义。
俄克拉荷马雷霆队是一个极具特点的球队。虽然他所处的俄克拉荷马是一个小市场,这座城市的家庭入息中位数全美排名第148,当地居民的消费能力并不是很强,但雷霆还是能够年入2.22亿美元,利润6400万美元排在NBA球队第七位。可见俄克拉荷马的篮球氛围以及雷霆队的影响力。他们以年轻有活力、身体素质劲爆、重视防守为特点,以球星带队的打法为核心,凭借其强硬的球风收获了众多忠实粉丝。近三年,雷霆队的表现有些挣扎,连续折戟在季后赛首轮,当下急需寻找问题、发现问题,从而进行人员调整、战术布置,在新的赛季里完成突破。本文正是以此为出发点,以教练的视角,研究NBA俄克拉荷马雷霆队胜负影响因素,尤其是较为可控的间接因素,为雷霆队的人员配置、战术安排提供一定参考。
二、数据来源与说明本文使用的数据是在NBA数据中文网(http://www.stat-nb *** /)爬取的比赛数据,包括俄克拉荷马雷霆队在2016-2019三个赛季中所有的常规赛和季后赛数据。经过数据预处理,共有250条数据,共包括18个变量,因变量为比赛结果(胜负情况),其余17个为自变量。可分为基本情况、球队进攻、球队防守、球星表现四类。具体变量说明如表2-1所示。
表2-1 数据变量说明表
三、描述性分析本文试图以教练的视角,研究NBA雷霆队近三年来的胜负影响因素,首先进行描述性分析,初步判断比赛结果与各潜在因素之间的关联,为后续建模做铺垫。
01因变量:比赛结果通过雷霆队近三个赛季胜率随时间变化的折线图(图3-1)可以看出,一方面,近三年来雷霆队的胜率大体上比较稳定,保持在55%至58%之间,相应的球队最终成绩也均止步于季后赛首轮。另一方面,球队胜率有着逐步升高的趋势,反映了球队在杜兰特出走后不断补强、不断磨合,有着良好的上升势头。所以,下个赛季将是能否在前三个赛季的经验积累下完成突破的关键赛季,教练的任务十分艰巨。
图3-1 雷霆队胜率随时间变化图
02自变量:基本情况基本情况共包括3个自变量:是否背靠背、比赛地点、轮换人数。
是否背靠背:背靠背作战会影响球员的体能,进而影响球队的状态。从图3-2(a)可以看出,非背靠背作战时,雷霆队的胜率略高于背靠背作战,但影响程度并不大。这可能是由于雷霆队有着平均年龄低,身体素质好的特点,相较一般球队来说体力更加充沛。作为教练,应该让两场比赛间隔时间的训练,多以战术布置、体能恢复为主,减少对抗训练,帮助球员调整至良好身体状态。
比赛地点:从图3-2(b)可以看出,雷霆队在主场比赛时,胜率明显高于客场比赛。可见雷霆队所在的俄克拉荷马城虽然是个小城市,但是主场氛围非常好,同时球队由于较年轻,客场作战的经验还有所欠缺。作为教练,可以在客场作战时,多注意调动球员积极性,并在场上局面不利时多运用暂停、罚球等休息时间,让对方主场的高涨气氛缓和下来,伺机反击。
轮换人数:从图3-2(c)中可以看出雷霆队大部分比赛轮换人数为9-11人,胜率随着轮换人数增加而增加。可见上场球员人数越多,体力越充沛,越容易拿下比赛。但往往轮换人数受到战术配合、板凳深度、伤病情况等限制,无法做到让更多球员上场。优秀的教练会尽量解决这一问题,让更多的角色球员参与到比赛中,分担主力压力。
图3-2(c)轮换人数与比赛结果的棘状图
03自变量:球队进攻球队进攻共包括8个自变量:得分、真实命中率、助攻、失误,三分出手数、罚球出手数、前场篮板占比、替补得分占比。前4个自变量反映了整体进攻表现,属于影响胜负的直接因素,后4个自变量反映了进攻结构,属于一定程度上可控的间接因素。
得分、真实命中率:从图3-3(a)、图3-3(b)可以看出真实命中率与得分有着相似的影响趋势,获胜场次得分的平均水平、真实命中率的平均水平都明显高于败北场次。这符合基本认知,真实命中率与得分有着高度正相关性。从图中也可以看出雷霆队进攻不稳定,得分和真实命中率波动幅度都较大。
助攻、失误:助攻和失误反映了球队进攻的流畅程度。从图3-3(c)可以看出获胜场次助攻的平均水平明显高于败北场次。从图3-3(d)可以看出,失误有着相反的影响趋势。一方面,这是由于失误中很大一部分比例来自于传球失误,即失误与助攻存在着一定的负相关关系,通常失误数越多,助攻数越低。另一方面,过多失误会给对手带来大量快攻的机会,也会使球队获胜难度增加。
三分出手数、罚球出手数:这两种出手数的多少代表了球队的进攻选择,三分出手数多代表本场比赛的战术以远投为主,罚球出手数多代表战术以冲击内线为主。从图3-3(e)和图3-3(f)可以看出获胜场次的三分出手数更低,罚球出手数更高,这与雷霆队身体素质好,善于冲击内线、不善于远投的特点相符。从教练的角度来看,如果能充分发挥造杀伤、搏罚球的战术,获胜的可能性将大大增加。
前场篮板:从图3-3(g)可以看出,获胜场次前场篮板的平均水 *** 而低于败北场次。这与联盟的普遍情况相悖,大多数球队前场篮板对比赛结果有着积极作用,因为更多的前场篮板会带来更多的进攻机会。这可能是由于相较其他球队而言,雷霆队不依赖于二次进攻,二次进攻的得分率较低。教练可以布置类似让中锋亚当斯一人拼抢前场篮板,其余球员快速退防的战术,有效遏制对手快攻。
替补得分占比:从图3-3(h)可以看出,替补得分占比对于比赛结果的影响并不明显。
04自变量:球队防守球队防守共包括4个自变量:防守篮板、直接破坏进攻数、对手真实命中率、犯规。
防守篮板、对手真实命中率:防守篮板数与对手真实命中率直接相关,所以导致了对比赛结果有着相反的影响趋势,从图3-4(a)、图3-4(b)可以看出获胜场次防守篮板的平均水平明显高于败北场次。获胜场次对手真实命中率的平均水平明显低于败北场次。很好的体现了雷霆队以防守著称的特点。作为教练,应该指导球队继续加强防守训练,同时提高拿下后场篮板后的转换进攻成功率,充分发挥球队优势。
直接破坏进攻数:抢断和盖帽能直接破坏对手进攻,并且获得快速反击机会,雷霆队更是一支依赖快速反击的球队。从图3-4(c)可以看出获胜场次直接破坏进攻数的平均水平明显高于败北场次。教练指导球队建立良好的防守体系,通过包夹、协防等战术,能增加直接破坏进攻的次数。
犯规:从图3-4(d)可以看出,雷霆队总犯规数对于比赛结果的影响并不明显。
05自变量:球星表现雷霆队在近三年来的绝对核心是MVP球员威斯布鲁克,本文研究的球星表现共包括2个自变量:威斯布鲁克是否取得三双、威斯布鲁克的EFF效率值。
是否取得三双:威斯布鲁克在近三年达成了蝉联场均三双的伟大成就,但也有很多人质疑他为了私心恶意“刷数据”,伤害球队。从图3-5(a)可以看出,威斯布鲁克达成三双对球队的胜率有着重大贡献,有力地回击了这一言论,反映出了球星良好的数据表现与球队获胜之间相辅相成的关系。
EFF效率值:EFF效率值是综合了得分、篮板、助攻、命中率等数据的球员表现评价指标,从图3-5(b)可以看出,获胜场次威斯布鲁克的EFF效率值的平均水平明显高于败北场次,同样反映了他对雷霆队能否取胜的重要作用,另外可以看出威少的EFF效率值波动较大,可谓“成也威少,败也威少”。作为教练,应该以威少为核心制定合适的战术,充分发挥威少的技术特点,从而带动球队整体表现。同时,威少是位容易情绪化的球员,在赛场上教练也应该及时发现并帮助他冷静下来,减少低效率的表现。
综上,通过对数据的描述性分析,可以发现除替补得分占比和犯规外,其余自变量均对比赛结果有一定影响。同时,以上变量很好地反映了雷霆队进攻不稳定、重视防守、较年轻、依赖球星威少等特点,可以依此给予教练一些初步的建议。
四、胜负影响因素统计模型01模型建立为了深入挖掘雷霆队的胜负影响因素,本文将建立logistic回归模型。由于有中间效应的存在,即部分变量之间互相有影响,导致使用全部变量进行回归时,有些变量的系数估计出现与描述性分析相悖的情况。经计算,变量得分、助攻、真实命中率、对手真实命中率的VIF较高,说明与其他变量高度相关。同时由于这四个变量属于影响胜负的直接因素,为了寻找有指导意义的间接因素,本文将这四个变量去掉后再进行回归,结果如下。
注:***0.001显著;**0.01显著;*0.05显著;. 0.01显著
从表4-1中可以看出,所有变量的正负号即影响趋势与描述性分析的结论相同。在0.05的显著性水平下,共有8个自变量是显著的。由于模型中仍包含很多不显著的因素,因此考虑根据AIC、BIC准则选择更简洁的模型,回归结果如下。
表4-2 AIC模型和BIC模型回归系数表
注:***0.001显著;**0.01显著;*0.05显著;. 0.01显著
从表4-2中可以看出,AIC模型保留了八个变量,BIC模型保留了六个变量。进一步计算了三个模型的AUC值,得到原模型的AUC为0.846,AIC模型为0.836,BIC模型为0.819,差距不大。综合考虑复杂程度和预测精度,选择BIC模型作为NBA雷霆队胜负影响因素的统计模型。
02模型解读通过表4-2,我们可以得到以下结论,在控制其他影响因素不变时,有:
对于比赛地点而言,主场作战比客场作战更容易获胜;
对于三分出手数而言,出手次数越多,越不容易获胜;
对于后场篮板而言,后场篮板抢的越多,越容易获胜;
对于直接破坏进攻数而言,破坏次数越多,越容易获胜;
对于威斯布鲁克是否三双而言,取得三双场次比未取得场次更容易获胜。
对于威斯布鲁克EFF效率值而言,EFF越高,越容易获胜。
综上所述,在主场作战、进攻战术偏向冲击内线(三分球出手数少)、防守表现出色(防守篮板及直接破坏进攻数多)、威少状态神勇(取得三双及EFF效率值高)的场次获胜可能性较高。
03模型预测根据图4-1中BIC模型的ROC曲线,我们以约登指数(灵敏度与特异度之和减一)更大为准则,可以选取更佳阈值约为0.486。对于每场比赛,当模型得到的预测概率大于0.486时,预测为胜利,否则预测为失败。经计算,模型的整体错判率为24.0%,TPR为66.1%,FPR为16.3%。
图4-1 BIC模型的ROC曲线
另外,如果以样本中的胜率0.56作为阈值,可以计算出模型的整体错判率为26.4%,TPR为75.9%,FPR为29.4%。可以看到用0.486作为阈值时整体错判率更低,FPR更低,用0.56作为阈值时TPR更高,总体差异不大,可根据具体问题选取更合适的阈值。
五、实际应用通过胜负影响因素统计模型,可以得到以下两个主要的应用:
01战术指导本文研究的雷霆队胜负影响因素是以教练的视角进行的,得到的结果可以为教练战术布置提供一定的指导建议。例如:
根据结论三分球出手数少、罚球出手数多的场次更容易获胜,教练可以利用球队冲击内线能力强的优势,主打突破、空切、低位单打等战术,多造成杀伤,减少投篮机会差的三分球出手,在对方防守有针对性地收缩内线时,再伺机远投空位三分,从而充分发挥己方优势、弥补不足,提高得分效率。
根据结论防守篮板多、直接破坏进攻数多的场次更容易获胜,教练可以在防守战术和人员安排上多下功夫,在遇到场上进攻不顺的情况时,换上防守能力出众、攻防转换速度快的阵容,利用雷霆队罗伯森、弗格森、格兰特等人年轻、身体素质劲爆的特点,在威少的带领下,主打防守反击,打开局面。
其余结论也可以类似地给教练提供一些建议。
02结果预测胜负影响因素统计模型另一个重要的应用是对于比赛结果预测,从而帮助教练及时人员、战术调整。
例如在某场比赛中,我方受到对手主场气氛的干扰,上半场表现不佳,球队在进攻端出手了20次三分球却命中率低下。对手利用这一点得到多次得到转换进攻机会,我方阵地防守的优势未能发挥,仅抢到16个后场篮板,有6次抢断、盖帽。球星威少当天状态不佳,表现也十分挣扎,EER仅为13,距离达成三双相差甚远。如果下半场延续这样的表现,根据模型可计算出获胜几率仅为11.1%,局面岌岌可危。
教练在中场休息时可根据上半场的数据进行人员、战术调整,派上防守能力出众的球员,减少三分球出手,多冲击内线,利用罚球迫使对手打阵地战,加强后场篮板和抢断、盖帽,利用防守反击的策略追分。如果能在下半场出手15次三分球,取得24个后场篮板、8次抢断、盖帽的数据,即使球星威少仍延续上半场的状态,也能将胜率提高到52.6%。如果威少能在中场休息时做出调整,在下半场爆发,将EFF提高到30并达成三双,胜率会达到74.7%,翻盘的可能性将大大增加。
六、结论与展望通过以上对于NBA雷霆队胜负影响因素的分析,可以得到如下结论:
比赛结果与比赛地点、进攻选择、防守表现、球星状态有关联,在主场作战、三分球出手数少、防守篮板及直接破坏进攻数多、威少EFF效率值高并取得三双的场次获胜可能性较高。
按照上述特征,可以为教练战术布置提供一定的指导建议,利用主场优势,多冲击内线,主打防守反击。
在比赛的过程中,可以根据建立的胜负影响因素统计模型实时测算获胜概率,从而帮助教练及时调整人员、战术。
本案例仍存在一些不足,可以在未来完善:
反映球队表现、战术的变量仍有很多值得发掘,由于数据获取能力的限制,本文研究的变量数量有限,在未来可以继续挖掘胜负影响因素。
当下正值休赛季,NBA中每支球队都会利用这个时间段进行人员调整,由于雷霆队核心阵容发生了较大变化,本文的研究只能作为参考,但研究 *** 可在未来推广至其他阵容稳定的球队。
很荣幸能参加人才计划活动,这几周的训练让我大大的提高了数据分析能力,从代码到文字,各个方面都得到了提高,也让我更加喜欢数据分析。在我看来,它不仅仅是一门技术,更像是一门艺术。最后,我想向狗熊会的老师们表示由衷的感想!