logo资料库

北航数理统计大作业.pdf

第1页 / 共11页
第2页 / 共11页
第3页 / 共11页
第4页 / 共11页
第5页 / 共11页
第6页 / 共11页
第7页 / 共11页
第8页 / 共11页
资料共11页,剩余部分请下载后查看
运动员价值的判别聚类分析 摘要 人所共知,运动员提升能力,技术是关键,力量是基础,配合的好坏决定 运动员的能力,直接影响运动成绩。因此,为了判别运动员的素质,分析运动员 的配合十分重要。本文以首先选取了 2014-2015 NBA 球员作为研究对象,并选取 了 7 个主要评价指标作为样本,进一步利用统计软件 SPSS 进行了聚类及判别分 析。从而将选秀球员进行了分类。 关键词:运动员,聚类分析,判别分析,数理统计
1,引言 NBA 选秀(NBA Draft)为一年一度的 NBA 挑选新球员的盛会。在选秀大会 上,30 支 NBA 球队都可以挑选想加入 NBA 的年轻男性球员,被选中的球员则被 称为 NBA 新秀。所有的美国球员都可以在他们大学毕业之后自动进入 NBA 选秀, 也可以在他们高中毕业之后至他们完成大学学业之间这段时间宣布参加选秀。 NBA 选秀(NBA Draft)为一年一度的 NBA 挑选新球员的盛会。在选秀大会上, 30 支 NBA 球队都可以挑选想加入 NBA 的年轻男性球员,被选中的球员则被称为 NBA 新秀。所有的美国球员都可以在他们大学毕业之后自动进入 NBA 选秀,也可 以在他们高中毕业之后至他们完成大学学业之间这段时间宣布参加选秀。本文 选取了参与 2014-2015 赛季 NBA 选秀球员的数据,包括球员的场均得分、 篮板、助攻、盖帽、抢断、犯规、失误等,进而将球员分别分成两类。其 后选取了其他球员的数据,判断其应该分类的轮次。通过对球员分类的结 果与 NBA 官网数据进行比对,发现其基本一致,充分说明了本文进行的分 析是合理的,具有一定科学性。 2,源数据的提取 本文数据全部来自虎扑网,以报名参与选秀的球员作为统计对象,表 1 给出了本文中需要用到的原始数据。 表 1,由虎扑网提取的源数据 编号 球员姓名 得分 篮板 助攻 抢断 盖帽 失误 犯规 1 2 3 4 5 6 7 8 9 Shabazz Muhammad Nerlens Noel Cody Zeller Rudy Gobert Alex Len Isaiah Austin Alex Poythress Archie Goodwin Mason Plumlee 16 12 6 1 0.5 0 2.3 8.3 2.7 2.5 3.2 1.3 15.9 7.8 1.4 1.3 1.6 1.3 11 15.2 3 9 0 0.7 1 0 2 3 2 4 2 0 2.5 1.2 2.3 14.2 8.2 1 0.2 0.4 1.6 3 15.8 6.5 0.3 0.2 0.3 2.3 2.5 16.3 5.5 4.5 0.7 1.2 3.2 2 19.9 11 1.7 0.6 1.7 2.7 2.7 10 James McAdoo 15.5 8.7 1.2 1.3 0.3 3.8 1.7
Tony Mitchell (North Texas) 17 8.8 0.4 2.2 3 2 3 C.J. McCollum 26.3 5.3 3.1 1.1 0.3 2.6 2.1 Otto Porter B.J. Young Dario Saric LeBryan Nash Trey Burke 12.5 7.5 3 1.5 2.3 2.3 2 20.5 3.8 3.3 1 0.3 0.5 2.5 3.9 3 0.7 0.8 0.4 0.8 2.4 18.8 6.4 2 1.2 0.4 2.8 3 15.8 3 7.4 0.8 0.4 2.4 1.8 Sergey Karasev 18 4.3 2 Michael Carter-Williams 10.3 5.5 9.3 C.J. Leslie Michael Snaer Reggie Bullock Mike Moser 0 4 1 0.5 2 2.8 0.8 2.8 2.3 1 2.7 2.5 11.7 7.5 1.3 15.3 5.8 2.3 0.7 0.3 3 2.7 10.7 5.2 2.8 1.8 0.3 1.2 1.5 12.8 10 3 0.8 0.8 2.8 2 Deshaun Thomas 22.4 6.2 1.2 0.8 0.2 1.2 1.6 Jackie Carmichael 16.2 6.8 0.8 1.5 2.5 3.2 2.5 NemanjaNedovic Leo Westermann Trevor Mbakwe Lorenzo Brown Russ Smith Brandon Paul Rodney Williams Ray McCallum Elijah Johnson Doug McDermott Richard Howell DeWayne Dedmon Isaiah Canaan Lucas Nogueira Raul Neto 11 2.3 2.3 1 0.2 2.5 2.5 9.8 2.3 3.8 0.5 0 2.5 3.5 8.1 6.4 0.6 0.8 1.3 1.9 2.6 10.5 4.7 6 2.2 0.3 3.8 1.8 19.2 3.2 1.8 3 0 3.2 2.7 4.1 1.3 0.6 2.4 2 19 14.1 20.3 5 6 4 2.1 3.3 10.7 2.3 4.2 1 2 1 1.6 1.8 2.8 0.5 2.5 3 0 2.7 2.2 21 7.3 1.1 0.4 0.1 2.7 1.4 14.2 7.8 1.2 1.2 0.5 1.5 3.3 6.7 7.7 0.7 24.8 3.2 3.6 1 1 1.3 1 3.2 0.4 2.2 2.4 2.7 2.4 0.4 0.4 12.3 2.7 3.6 1.6 1 0 0.7 1.8 2 2.3 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 3,聚类分析过程 聚类分析是根据研究对象的特征对特定的研究对象进行分类的多元统 计分析技术的总称,它直接比较各事物之间的性质,将性质相近的归为一 类,将性质差别较大的归入不同的类。本文采用的是系统聚类分析,它又
称集群分析,是聚类分析中应用最广的一种方法。它根据样本的多指标(变 量)、多个观察数据,定量地确定样品,指标之间存在的相似性或亲疏关系, 并据此连接这些样品或指标,归成大小类群,构成分类树状图或冰柱图。 判别分析是根据多种因素(指标)对事物的影响来实现对事物的分类, 从而对事物进行判别分类的统计方法。判别分析使用与已经掌握了历史上 分类的每一个类别的若干样品,希望根据这些历史的经验(样品),总结出 分类的规律性(判别函数)来指导未来的分类。 3.1 聚类分析步骤 进入 SPSS19.0 程序,将采集到得数据输入到数据编辑器中,选择分析 -分类-系统聚类,进行聚类分析,引入的变量是姓名、得分、篮板、助攻、 抢断、盖帽、失误、犯规。聚类方法是选择马氏距离方法,这样可以消除 由于各自变量量纲不同造成的影响。聚类数设置为 2.其他均为默认设置。 点击确认开始进行计算,得到以下计算结果。 表2,案例处理汇总a,b 有效 案例 缺失 总计 N 百分比 N 百分比 N 百分比 40 100.0 0 .0 40 100.0 a. Minkowski (2) 距离已使用 b. 平均联结(组之间) 表2中分别为有效案例、缺失案例和案例综述的个数和百分数。 表3显示了SPSS聚类分析步骤,共40步。 表3,聚类表 群集组合 首次出现阶群集 阶 群集 1 群集 2 系数 群集 1 群集 2 下一阶 1 2 3 4 5 6 7 8 9 27 1 6 26 31 28 26 2 24 34 21 7 40 33 37 27 13 35 1.718 1.814 1.949 2.057 2.200 2.207 2.310 2.364 2.375 0 0 0 0 0 0 4 0 0 0 0 0 0 0 0 1 0 0 7 15 14 7 13 25 26 20 24
10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 32 11 5 9 6 1 9 12 20 9 2 8 1 9 16 15 2 1 2 9 1 4 1 1 1 9 4 1 1 1 36 25 32 31 10 5 30 38 23 18 22 17 11 14 24 28 26 3 29 16 20 15 6 8 2 12 39 9 19 4 2.377 2.544 2.730 2.793 2.809 2.995 3.149 3.257 3.270 3.288 3.395 3.418 3.611 3.620 3.801 3.808 4.053 4.384 4.407 4.804 4.822 5.435 5.488 5.972 6.435 6.482 7.091 8.469 10.657 10.978 0 0 0 0 3 2 13 0 0 16 8 0 15 19 0 0 20 22 26 23 27 0 30 32 33 29 31 34 37 38 0 0 10 5 0 12 0 0 0 0 0 0 11 0 9 6 7 0 0 24 18 25 14 21 28 17 0 35 0 36 12 22 15 16 32 22 19 35 30 23 26 33 27 29 29 31 28 30 34 35 32 36 33 34 37 37 39 38 39 0 图1,分析得到的树状结构图
图2,聚类分析结果
图 2 显示了球员类型的归属,其中根据球员编号将球员分为三类: 第一类:1、2、3、5、6、7、8、10、11、13、17、20、21、22、23、25、 26、27、29、32、34、36、40; 第二类:9、12、14、16、18、24、30、31、33、35、38; 第三类:19、28、37、15、4、39。 由于抽签选秀只有两轮,可将第二类和第三类球员归到一类进行分析,合并 后的第一类球员不变,第二类为: 第二类(新):4、9、12、14、15、16、18、19、24、28、30、31、33、35、 38、39。
3.2 判别分析 进入 SPSS19.0 程序,选择分析—分类—判别,将上面聚类分析得到的结果 作为分类变量,其他作为自变量。由于上述将 40 名球员分成了两类,定义分组 变量的取值范围为 1-2,得到以下分析结果: 表4给出了2个分类总体的均值和标准差。 表4 组统计量 有效的 N(列表状态) 均值 标准差 未加权的 已加权的 合计 得分 14.7100 5.14128 篮板 抢断 盖帽 助攻 犯规 失误 5.7600 2.33949 1.1475 .80319 .8625 .87726 2.3975 1.96175 2.4350 .57269 2.1350 .88334 协方差矩阵的均等性的箱式检验 对数行列式 分组 秩 对数行列式 1 2 汇聚的组内 7 7 7 -.015 1.868 2.619 分组 1 2 得分 篮板 抢断 盖帽 助攻 犯规 失误 得分 篮板 抢断 盖帽 助攻 犯规 失误 16.7174 2.27029 6.2043 2.38127 1.1087 .66121 .9870 1.04198 2.4783 1.81933 1.3870 .53369 2.3217 .77574 12.0529 7.34916 5.1588 2.20824 1.2000 .98298 .6941 .57497 2.2882 2.19257 3.5000 .63246 1.8824 .97803 23 23 23 23 23 23 23 17 17 17 17 17 17 17 40 40 40 40 40 40 40 23.000 23.000 23.000 23.000 23.000 23.000 23.000 17.000 17.000 17.000 17.000 17.000 17.000 17.000 40.000 40.000 40.000 40.000 40.000 40.000 40.000
分享到:
收藏