论文部分内容阅读
[摘 要] 目前高职学生综合素质评价多以简单的加权线性关系作为评价模型,这种评价依赖于经验或主观判断,利用数据挖掘算法,将学生的各类综合素质得分进行聚类分析,进而划分为不同的类别,弱化排名对学生综合素质评价带来的影响,使大学生综合素質评价更加科学、有效,为高校学生管理工作提供决策支持。
[关 键 词] 数据挖掘;综合素质评价;神经网络
[中图分类号] G712 [文献标志码] A [文章编号] 2096-0603(2021)23-0090-02
一、引言
开展全方位的素质教育是高职院校提升人才培养质量的主要手段,而如何科学系统地评价大学生的综合素质,是现代大学教育的一个重要研究课题。习近平总书记在全国高校思想政治工作会议上强调,“要重视和加强第二课堂建设,重视实践育人,坚持教育同生产劳动和社会实践相结合,广泛开展各类社会实践,让学生在亲身参与中认识国情、了解社会,受教育、长才干”。综合素质教育对训练学生开放的知识结构、多维的能力结构、不懈的探索精神,培养学生的开放思维、健全人格具有积极促进作用。目前高职院校综合素质评价体系仍存在指标僵化、不够客观等问题,主要是因为大学生的综合素质评价具有维度较大、过程复杂、个体发展不均衡的特点,并随着学生的成长,评价体系会不断动态进化,不同年级的学生评价标准不尽相同。研究如何对大学生综合素质进行科学、有效、系统的评价,并利用评价结果反作用于学生管理,对高职院校人才培养质量的整体提升具有重要的意义。
二、高职学生综合素质评价模型
高职综合素质评价中最常见的评价方案是将评价的指标和结果看作简单的加权线性关系,例如学年综合测评=学业成绩×60%+综合素质积分×40%。以此综合评测为依据,各专业年级依据学生测评得分的名次进行评优评奖,学校和各二级学院按测评总分高低进行审批入党、就业推荐等,并评选出优秀毕业生。而对于综合素质积分,一般通过选择多种评价指标,例如身心健康、创新创业、技术技能、人文艺术等,对这些指标数据还要再一次进行加权赋值。而对于评价结果来说,一般的做法是依据加权赋值之后的计算结果进行排名,或者用“优秀”“良好”“合格”“不合格”这样的等级作为定性结果。
这种局限于简单的赋权评价难以抓住以“职业道德素养、技术技能水平和就业创业能力”为核心要素和关键环节的高职教育关键点,因为实际上综合素质指标和结果之间是一个非常复杂的非线性关系。本文通过数据挖掘算法,寻找各类评价数据中的联系,弱化排名对学生综合素质评价带来的影响,使大学生综合素质评价更加科学、有效,为高校学生管理工作提供决策支持。
三、数据挖掘
数据挖掘就是从大量的样本数据中,寻找其规律的技术,一般可以分为描述和预测两类,可以分析出隐藏的但潜在有用的信息。数据挖掘的算法主要包括神经网络、决策树、仿生算法、粗糙集、模糊集、关联规则等,国内已有学者和专家利用数据挖掘技术对大学生综合素质教育数据进行研究[1],对高职学生综合素质评价的研究也取得了许多成果,也有学者结合学生大数据对高职学生综合素质评价体系进行研究。例如刘晓飞[2]、陈凤[3]等阐述了大数据在学生综合素质评价中的应用价值及创新构建优化测评模型。本文提出基于自组织特征映射神经网络 SOM[4]方法进行数据挖掘分析。
四、应用实现
神经网络是通过模拟人脑神经生理特性而建立的算法总和,该模型把神经元抽象为逻辑器件,把大量的神经元联结成网络结构,通过设置逻辑器件的阈值和权重来模拟复杂系统。20世纪80年代,神经网络进入高速发展时期,涌现出一系列重要成果:玻尔兹曼机、BP神经网络、并行计算理论、最大互信息理论、径向基神经网络等。神经网络在理论完善的同时,在模式识别、系统辨识、推荐系统、分类回归、图像与自然语言处理等应用方面也获得了极大发展。神经网络的知识信息以分布式的方式存储在各个连接权重上,部分神经元的损坏并不能带来太大的影响,具有较强的容错性。
SOM算法是人工神经网络的一种,最大的优点是不需要提供前期的标签信息,算法过程中能很好地保留输入层的拓扑结构。因此,可利用SOM处理高职学生综合素质评价得分结果差异,分别将个体样本归类到不同的组别,以组内差异小、组间差异大的方式进行聚类。聚类结果将学生划分为不同的类别,通过此结果作为下一步评测的依据。该方法比较传统的方法,避免了绝对排名的弊端,弱化了“唯名次论”对学生综合素质评价带来的影响。
SOM分为输入层和输出层两层。输出层的神经元采用竞争的方式激活,每个神经元有一个权值向量,输入层的每一个向量x会激活与之最接近的神经元,这个神经元叫作获胜神经元(winner)。输出层的所有的神经元组织成一个网格,网络的结构通常取决于输入的数据在空间中的分布,网格可以是四边形、六边形、链状等,可以由算法自行设定,一般情况的输出是一个二维的矩阵。
将SOM应用于高职学生综合素质评价,不同于通过计算每项分类的权重,然后再依据得分排名的方式,而是依据每一项综合素质评价得分结果差异,分别将其归类到不同的组别,以组内差异小、组间差异大的方式进行聚类,然后在不同的类别中再进行评价和认定。算法的具体步骤如下:
1.选取同一专业同一年级的数据,例如200个学生的分类得分数据作为数据样本,用作SOM算法输入,输入样本格式为: x=(x1,x2,……xn),其中7个维度分别代表思想政治、身心健康、创新创业、技术技能、人文艺术、志愿服务、劳动实践7个模块的得分,因此,神经网络的输入层节点个数设置为7。 2.输出层每个神经元随机初始化自己的参数,参数的维度与输入向量的维度相同,用试凑法,依据输入样本的数量设置输出节点个数200,得到输出层最佳形状为采用6*6的二维矩阵结构,即输出层的所有神经元组织成一个四边形的网格。
3.输入层选择的每一个样本数据,找到被它激活的获胜神经元节点。计算方法如下:若输入样本数据为n维的向量,x=(x1,x2,……xn),那么可用欧几里得距离判别获胜神经元节点,取距离最小的节点为获胜神经元,距离计算公式为dj=■(xi(t)-wij(t))2。
4.找到激活的获胜神经元节点之后,按照与这个节点的距离远近,设定这个节点的领域,更新和它临近的节点,使得距离获胜节点越近的,更新的权重越大。更新权重的计算公示为:Tj,I (x)=exp(-S2j,I (x)/2σ2,),其中I (x)表示获胜节点,Si,j表示节点i、j之间的距离。
5.按照梯度下降法更新输出层每个神经元节点的参数,循环迭代,直到收敛。更新公式为:ΔWij=r(t)Tj,I (x)(t)(xi(t)-Wij(t)),其中r(t)表示随着迭代次数的变化逐渐下降的学习率,一般初始学习率为一个(0,1)之间的小数,t表示迭代次数。初始学习率设置为0.5,依据最大迭代次数完成算法输出。
算法完成后,依據最终得到的输出层权值矩阵,可以得到每个神经元之间的可视化距离矩阵,此时再依据输出层各神经元的距离进行聚类,保证同一组内差异小,不同组间差异大。最后,依据聚类结果对每个获胜神经元所捕获的样本归类分组,不同的学生分别归类到不同的组别,用于综合素质评价。
五、结论
SOM算法将完全保留输入层的拓扑结构或顺序,可以实现从输入空间(思想政治、身心健康、创新创业、技术技能、人文艺术、志愿服务、劳动实践7个维度)到输出矩阵(6*6)的映射。最后通过输出后的二维平面,对每个节点的权值进行欧式距离计算,得到保持数据拓扑特征的可视化距离矩阵,以组内差异小、组间差异大的方式进行聚类,完成高职学生综合素质得分的科学分类,不同的学生分别将其归类到不同的组别,使综合素质评价更加科学、有效。
参考文献:
[1]郭健,蓝箭,李文博,等.基于学生综合素质评价的数据挖掘改进算法研究[J].工业控制计算机,2018,31(2).
[2]刘晓飞,廉武辉.大数据视角下高校大学生综合素质评价机制创新研究[J].考试研究,2016(5).
[3]陈凤.大数据时代高校综合素质测评模型优化研究[J].多媒体与教学,2017,4(32).
[4]Kumar K. Self-Organizing Map (SOM) Neural Networks for Air Space Sectoring[C]. International Conference on Computational Intelligence & Communication Networks. IEEE, 2015.
编辑 栗国花
[关 键 词] 数据挖掘;综合素质评价;神经网络
[中图分类号] G712 [文献标志码] A [文章编号] 2096-0603(2021)23-0090-02
一、引言
开展全方位的素质教育是高职院校提升人才培养质量的主要手段,而如何科学系统地评价大学生的综合素质,是现代大学教育的一个重要研究课题。习近平总书记在全国高校思想政治工作会议上强调,“要重视和加强第二课堂建设,重视实践育人,坚持教育同生产劳动和社会实践相结合,广泛开展各类社会实践,让学生在亲身参与中认识国情、了解社会,受教育、长才干”。综合素质教育对训练学生开放的知识结构、多维的能力结构、不懈的探索精神,培养学生的开放思维、健全人格具有积极促进作用。目前高职院校综合素质评价体系仍存在指标僵化、不够客观等问题,主要是因为大学生的综合素质评价具有维度较大、过程复杂、个体发展不均衡的特点,并随着学生的成长,评价体系会不断动态进化,不同年级的学生评价标准不尽相同。研究如何对大学生综合素质进行科学、有效、系统的评价,并利用评价结果反作用于学生管理,对高职院校人才培养质量的整体提升具有重要的意义。
二、高职学生综合素质评价模型
高职综合素质评价中最常见的评价方案是将评价的指标和结果看作简单的加权线性关系,例如学年综合测评=学业成绩×60%+综合素质积分×40%。以此综合评测为依据,各专业年级依据学生测评得分的名次进行评优评奖,学校和各二级学院按测评总分高低进行审批入党、就业推荐等,并评选出优秀毕业生。而对于综合素质积分,一般通过选择多种评价指标,例如身心健康、创新创业、技术技能、人文艺术等,对这些指标数据还要再一次进行加权赋值。而对于评价结果来说,一般的做法是依据加权赋值之后的计算结果进行排名,或者用“优秀”“良好”“合格”“不合格”这样的等级作为定性结果。
这种局限于简单的赋权评价难以抓住以“职业道德素养、技术技能水平和就业创业能力”为核心要素和关键环节的高职教育关键点,因为实际上综合素质指标和结果之间是一个非常复杂的非线性关系。本文通过数据挖掘算法,寻找各类评价数据中的联系,弱化排名对学生综合素质评价带来的影响,使大学生综合素质评价更加科学、有效,为高校学生管理工作提供决策支持。
三、数据挖掘
数据挖掘就是从大量的样本数据中,寻找其规律的技术,一般可以分为描述和预测两类,可以分析出隐藏的但潜在有用的信息。数据挖掘的算法主要包括神经网络、决策树、仿生算法、粗糙集、模糊集、关联规则等,国内已有学者和专家利用数据挖掘技术对大学生综合素质教育数据进行研究[1],对高职学生综合素质评价的研究也取得了许多成果,也有学者结合学生大数据对高职学生综合素质评价体系进行研究。例如刘晓飞[2]、陈凤[3]等阐述了大数据在学生综合素质评价中的应用价值及创新构建优化测评模型。本文提出基于自组织特征映射神经网络 SOM[4]方法进行数据挖掘分析。
四、应用实现
神经网络是通过模拟人脑神经生理特性而建立的算法总和,该模型把神经元抽象为逻辑器件,把大量的神经元联结成网络结构,通过设置逻辑器件的阈值和权重来模拟复杂系统。20世纪80年代,神经网络进入高速发展时期,涌现出一系列重要成果:玻尔兹曼机、BP神经网络、并行计算理论、最大互信息理论、径向基神经网络等。神经网络在理论完善的同时,在模式识别、系统辨识、推荐系统、分类回归、图像与自然语言处理等应用方面也获得了极大发展。神经网络的知识信息以分布式的方式存储在各个连接权重上,部分神经元的损坏并不能带来太大的影响,具有较强的容错性。
SOM算法是人工神经网络的一种,最大的优点是不需要提供前期的标签信息,算法过程中能很好地保留输入层的拓扑结构。因此,可利用SOM处理高职学生综合素质评价得分结果差异,分别将个体样本归类到不同的组别,以组内差异小、组间差异大的方式进行聚类。聚类结果将学生划分为不同的类别,通过此结果作为下一步评测的依据。该方法比较传统的方法,避免了绝对排名的弊端,弱化了“唯名次论”对学生综合素质评价带来的影响。
SOM分为输入层和输出层两层。输出层的神经元采用竞争的方式激活,每个神经元有一个权值向量,输入层的每一个向量x会激活与之最接近的神经元,这个神经元叫作获胜神经元(winner)。输出层的所有的神经元组织成一个网格,网络的结构通常取决于输入的数据在空间中的分布,网格可以是四边形、六边形、链状等,可以由算法自行设定,一般情况的输出是一个二维的矩阵。
将SOM应用于高职学生综合素质评价,不同于通过计算每项分类的权重,然后再依据得分排名的方式,而是依据每一项综合素质评价得分结果差异,分别将其归类到不同的组别,以组内差异小、组间差异大的方式进行聚类,然后在不同的类别中再进行评价和认定。算法的具体步骤如下:
1.选取同一专业同一年级的数据,例如200个学生的分类得分数据作为数据样本,用作SOM算法输入,输入样本格式为: x=(x1,x2,……xn),其中7个维度分别代表思想政治、身心健康、创新创业、技术技能、人文艺术、志愿服务、劳动实践7个模块的得分,因此,神经网络的输入层节点个数设置为7。 2.输出层每个神经元随机初始化自己的参数,参数的维度与输入向量的维度相同,用试凑法,依据输入样本的数量设置输出节点个数200,得到输出层最佳形状为采用6*6的二维矩阵结构,即输出层的所有神经元组织成一个四边形的网格。
3.输入层选择的每一个样本数据,找到被它激活的获胜神经元节点。计算方法如下:若输入样本数据为n维的向量,x=(x1,x2,……xn),那么可用欧几里得距离判别获胜神经元节点,取距离最小的节点为获胜神经元,距离计算公式为dj=■(xi(t)-wij(t))2。
4.找到激活的获胜神经元节点之后,按照与这个节点的距离远近,设定这个节点的领域,更新和它临近的节点,使得距离获胜节点越近的,更新的权重越大。更新权重的计算公示为:Tj,I (x)=exp(-S2j,I (x)/2σ2,),其中I (x)表示获胜节点,Si,j表示节点i、j之间的距离。
5.按照梯度下降法更新输出层每个神经元节点的参数,循环迭代,直到收敛。更新公式为:ΔWij=r(t)Tj,I (x)(t)(xi(t)-Wij(t)),其中r(t)表示随着迭代次数的变化逐渐下降的学习率,一般初始学习率为一个(0,1)之间的小数,t表示迭代次数。初始学习率设置为0.5,依据最大迭代次数完成算法输出。
算法完成后,依據最终得到的输出层权值矩阵,可以得到每个神经元之间的可视化距离矩阵,此时再依据输出层各神经元的距离进行聚类,保证同一组内差异小,不同组间差异大。最后,依据聚类结果对每个获胜神经元所捕获的样本归类分组,不同的学生分别归类到不同的组别,用于综合素质评价。
五、结论
SOM算法将完全保留输入层的拓扑结构或顺序,可以实现从输入空间(思想政治、身心健康、创新创业、技术技能、人文艺术、志愿服务、劳动实践7个维度)到输出矩阵(6*6)的映射。最后通过输出后的二维平面,对每个节点的权值进行欧式距离计算,得到保持数据拓扑特征的可视化距离矩阵,以组内差异小、组间差异大的方式进行聚类,完成高职学生综合素质得分的科学分类,不同的学生分别将其归类到不同的组别,使综合素质评价更加科学、有效。
参考文献:
[1]郭健,蓝箭,李文博,等.基于学生综合素质评价的数据挖掘改进算法研究[J].工业控制计算机,2018,31(2).
[2]刘晓飞,廉武辉.大数据视角下高校大学生综合素质评价机制创新研究[J].考试研究,2016(5).
[3]陈凤.大数据时代高校综合素质测评模型优化研究[J].多媒体与教学,2017,4(32).
[4]Kumar K. Self-Organizing Map (SOM) Neural Networks for Air Space Sectoring[C]. International Conference on Computational Intelligence & Communication Networks. IEEE, 2015.
编辑 栗国花