论文部分内容阅读
数据挖掘是帮助人们在海量数据中发现信息和知识的工具。近年来数据挖掘技术成了智能研究的核心技术,被广泛应用到了诸多领域,引起了学术界极大的关注。在教育领域中,对学生学习能力进行分析非常重要。利用数据挖掘中的分类技术进行这种分析,对于改进教学有着实际的意义。数据分类是按照一组数据对象的特征给出数据对象划分的过程,已经在统计学、机器学习、神经网络以及专家系统中被广泛研究。实际上,分类是一个两步过程,第一步,建立一个模型,描述指定的数据类集或概念集;第二步,评估模型的预测准确率,如果模型的准确率可以接受,使用模型进行分类。通常,模型可以用分类规则、判定树或数学公式表示。目前常用的分类规则挖掘方法有神经网络、遗传算法、决策树方法等。本文主要采用神经网络作为数据分类挖掘的一种手段,研究其在教学中的应用。BP(Back Propagation)算法,即误差反传训练算法,以其良好的非线性映射逼近能力、泛化能力以及易实现性成为人工神经网络应用最广泛的训练算法。但是BP算法有其明显的缺陷,即梯度计算量大且复杂、训练速度慢、容易陷入局部极值等。基于对教育平台涉及数据量大,以及用于分类问题神经网络的特点等的考虑,本文引入粒子群优化算法思想改进BP算法(PSOBP),用于神经网络的训练中。粒子群优化算法本质上是一种概率寻优算法,对目标函数几乎没有什么要求,同时也非常适合大数据量的情况。PSOBP避免了传统BP算法的梯度计算,采用粒子群迭代,寻找最优的权值矩阵。实验证明这种新的BP算法能在迅速找到全局最小的基础上大大提高收敛速度,得到优于传统BP算法的分类效果。本文详细地讨论并实现了PSOBP算法思想,及其与标准BP算法间的实验数据对比,数据采集平台的构建,用于分类模型的样本选择和预处理、网络拓扑结构的选定等。最后,建立了基于PSOBP算法的学生学习能力分析模型(Learning-capability analysis model,简称:LCAM模型)。在该模型下将训练好的神经网络用于学生的真实英语能力的分析,取得了较令人满意的效果。