论文部分内容阅读
【摘 要】为了研究大学生的身体素质状况,我选取了15级部分学生的体质健康测试成绩作为样本。针对样本中的数据,首先,进行预处理,用BMI指数代替身高体重成绩,使结果更准确。对于未给出具体成绩的项目,用数字表示不同等级。其次,为了研究评分标准,运用SPSS的多元回归分析,确定总成绩与各指标的关系,进而对现有标准进行分析与评价。经过分析得知,仅从体测得分并不能了解大学生的体质状况。因此,通过主成分分析确定身体素质状况的具体三个方面,作为主成分。计算出主成分得分,进而在原有的基础上对同一类成绩的学生进一步划分。最后,在以上分析的基础上,从实际情况出发,给出我个人的一些建议。
【关键词】SPSS;MATLAB;多元回归;主成分分析
用于研究的数据来自2017-2018年度中央民族大学理学院15级学生的体质健康测试结果。通过简单的筛选,选出120名学生的成绩作为样本数据。其中包括七个指标:身高、体重、肺活量、50米跑、长跑、坐卧体前屈、立定跳远。
对数据进行预处理:
1)针对身高体重,考虑到单独分析某一项不具有代表性,而且男女生标准不同, 引入BMI指数,BMI=体重/(身高)^2。
通过查阅资料得到BMI指数的标准,如下表所示:
2)对部分成绩的处理
原数据中有的项目成绩只给出标准(及格、优秀、良好…),并未给出详细成绩。计划打算从总成绩推出每一项目的具体成绩,但考虑到可行性与实用性,未采取该方法。在这里,对未给出具体成绩的项目,进行简单量化处理,用1、2、3、4代表(不及格、及格、良好、优秀)四个等级,并进行后续的分析。
回归分析:
运用spss多元线性回归,分析总分与各项成绩的关系:
回归方程为:y=0.175x1+0.155x2+0.122x3+5.216x4+4.970x5+
2.919x6+4.551x7
采用标准化的方程系数,即
0.1157、0.1605、0.0891、0.1945、0.1678、0.1364、0.1360
通过查阅资料,得到各部分的权重分别为
0.15、0.15、0.1、0.1、0.2、0.2、0.1、0.1
比較各系数可以看出,系数大致吻合,由此可见,方程的拟合效果良好。
主成分分析:
由以上的分析可以看出,现有的标准虽然测试项目多样,评分很全面,但其也存在明显的问题,侧重面较为单一。除此之外,依照现有的标准,只是把检测的方面细化成具体的项目,而如果要从测试得分研究大学生的身体素质情况,则需要把这些总结成具体的身体素质指标。这一点与“降维”的思想类似,因此,下面将从主成分分析的角度对现有评分标准进行改进,并对数据中的大学生身体素质情况作出进一步的分析。
确定主成分并进行解释:
由主成分系数向量可以看出,第一主成分中,x4具有较大的正系数;第二主成分中,x3和x6具有较大的正系数;第三主成分中,x5的系数最大。由此看出,第一主成分中短跑占的比例较大,第二主成分中坐位体前屈和立定跳远占有相当大的比例,第三主成分中长跑占的比例最大。
因此,可将三个主成分分别解释为肌肉爆发力、身体柔韧度、心肺功能水平。
两个标准的简单对比分析:
与原先的标准进行对比后,从主成分分析的角度来研究学生的体测情况,其优点在于能从体测成绩更加直观地发现问题所在。在多项测试项目中,将项目具体化成身体素质的三个方面,即三个主成分,有利于对被测对象体质情况的分析,找出薄弱环节。但从合格率与得分情况来看,这种方法却有很大的局限性,不能很好的充当具体的评分标准。
参考文献:
[1]李婷.《spss数据分析报告》[Z]百度文库.2011-12-7.
[2]曾繁会,吕渭济《基于MATLAB的岭回归分析程序设计及其应用》
[3]百度文库《主成分分析法原理及应用》
[4]主成分分析及其改进——文献综述()
【关键词】SPSS;MATLAB;多元回归;主成分分析
用于研究的数据来自2017-2018年度中央民族大学理学院15级学生的体质健康测试结果。通过简单的筛选,选出120名学生的成绩作为样本数据。其中包括七个指标:身高、体重、肺活量、50米跑、长跑、坐卧体前屈、立定跳远。
对数据进行预处理:
1)针对身高体重,考虑到单独分析某一项不具有代表性,而且男女生标准不同, 引入BMI指数,BMI=体重/(身高)^2。
通过查阅资料得到BMI指数的标准,如下表所示:
2)对部分成绩的处理
原数据中有的项目成绩只给出标准(及格、优秀、良好…),并未给出详细成绩。计划打算从总成绩推出每一项目的具体成绩,但考虑到可行性与实用性,未采取该方法。在这里,对未给出具体成绩的项目,进行简单量化处理,用1、2、3、4代表(不及格、及格、良好、优秀)四个等级,并进行后续的分析。
回归分析:
运用spss多元线性回归,分析总分与各项成绩的关系:
回归方程为:y=0.175x1+0.155x2+0.122x3+5.216x4+4.970x5+
2.919x6+4.551x7
采用标准化的方程系数,即
0.1157、0.1605、0.0891、0.1945、0.1678、0.1364、0.1360
通过查阅资料,得到各部分的权重分别为
0.15、0.15、0.1、0.1、0.2、0.2、0.1、0.1
比較各系数可以看出,系数大致吻合,由此可见,方程的拟合效果良好。
主成分分析:
由以上的分析可以看出,现有的标准虽然测试项目多样,评分很全面,但其也存在明显的问题,侧重面较为单一。除此之外,依照现有的标准,只是把检测的方面细化成具体的项目,而如果要从测试得分研究大学生的身体素质情况,则需要把这些总结成具体的身体素质指标。这一点与“降维”的思想类似,因此,下面将从主成分分析的角度对现有评分标准进行改进,并对数据中的大学生身体素质情况作出进一步的分析。
确定主成分并进行解释:
由主成分系数向量可以看出,第一主成分中,x4具有较大的正系数;第二主成分中,x3和x6具有较大的正系数;第三主成分中,x5的系数最大。由此看出,第一主成分中短跑占的比例较大,第二主成分中坐位体前屈和立定跳远占有相当大的比例,第三主成分中长跑占的比例最大。
因此,可将三个主成分分别解释为肌肉爆发力、身体柔韧度、心肺功能水平。
两个标准的简单对比分析:
与原先的标准进行对比后,从主成分分析的角度来研究学生的体测情况,其优点在于能从体测成绩更加直观地发现问题所在。在多项测试项目中,将项目具体化成身体素质的三个方面,即三个主成分,有利于对被测对象体质情况的分析,找出薄弱环节。但从合格率与得分情况来看,这种方法却有很大的局限性,不能很好的充当具体的评分标准。
参考文献:
[1]李婷.《spss数据分析报告》[Z]百度文库.2011-12-7.
[2]曾繁会,吕渭济《基于MATLAB的岭回归分析程序设计及其应用》
[3]百度文库《主成分分析法原理及应用》
[4]主成分分析及其改进——文献综述()