前言
先看新闻吧。春节联盟爆发的惊人记录在绿军和热火的比赛中,凯尔特人后卫小托马斯打出了52分,其中第四节独揽29分,击中了比赛的3分球。(阿尔伯特爱因斯坦)(美国)。
但小托马斯身高仅仅175cm。不禁会想身高会限制位置吗,还有现在的NBA为什么后卫闪耀中锋却凤毛麟角?
数据获取
从NBA中国官方网站获取449名现役NBA球员的位置,身高,体重,国籍等数据。
数据分析
球员身高分布
library(ggplot2) ggplot(hy0209,aes(x=Position,y=Height,col=Position))+geom_dotplot(binaxis = "y",binwidth=0.5,stackdir="center")
几个有意思的异常值
NBA运动员最矮的人
意外发现联盟里有两名175cm的球员,这给那些热爱篮球的身高不够的骚年们多大的鼓励啊!!
NBA运动员最高的人
看到也有两个人身高同时达到了221cm,而且还都不是美国人。
可以发现,NBA中锋球员明显少于后卫及中锋,中锋的数量不及后卫及前锋的三分之一,近几年NBA缺少中锋的言论确实不少,
NBA球员国籍分布
NBA里容纳43个国家的顶级球员,还有4名球员国籍不详。75.5%的球员是来自美国,6.5%来自法国,加拿大,巴西。
各个球队的中锋配置
hy02092<-hy0209[which(hy0209$Position=="中锋"),] ggplot(hy02092,aes(x=team))+geom_bar(stat="count")
在中锋匮乏的NBA,有8个球队只配备了一名中锋,黄蜂队却配置了4个中锋,快攻见长的勇士也配有3名中锋,根据市场供给原则,大胆的预测下,在今年球员交易日截止前,黄蜂队必有中锋被交易。
1. 位置水平下的方差分析
将篮球队员的7个位置(我也不知道为何官方这样划分: 后卫, 后卫-前锋 , 前锋, 前锋-后卫, 前锋-中锋,中锋,中锋-前锋)看成7个水平,将7个位置下的身高看成该水平下的观测值
我们看不同水平下的观测值是否一样
> lamp<-da( + X=hy0210$Height, + A=hy0210$level) > lamp.aov<-aov(X ~ A, data=lamp) > summary) Df Sum Sq Mean Sq F value Pr(>F) A 1 25918 25918 1277 <2e-16 *** Residuals 447 9073 20 --- Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1看到P值 <2e-16,所以不同位置下的身高明显不同。
数据探讨
先看下球员身高体重的分布
既然身高对位置有影响,不妨按身高体重进行聚类,用kmeans聚成3类,看聚类的效果好不好
> cust<-hy[,2:3] > kmeans_result1<-kmeans(cust,3) > hy$jl2<-kmeans_result1$cluster > table(hy$Position,kmeans_result1$cluster) > ggplot(hy,aes(x=Height,y=Weight,colour=jl2))+geom_point()
发现聚类的效果还算明显,基本上也契合了位置的分布,第一类是中锋,第二类锋卫摇摆人,第三类后卫。
小结
身高确实限制了NBA球员的位置
黄蜂队会有中锋被交易。
End.
运行人员:中国统计网小编(微信号:itongjilove)
微博ID:中国统计网
中国统计网,是国内最早的大数据学习网站,公众号:中国统计网