论文部分内容阅读
随着计算机技术的快速发展,对数据进行深度分析的需求逐渐增多,数据挖掘技术的应用越来越广泛。结合我国实际,针对教育部规定的高校评估指标体系中的生均教学行政用房面积指标是否合理的问题,采用有效的数据挖掘方法对大量的历史数据进行分析,为高校及教育部门决策者提供相关依据,充分利用高校资源。首先,对数据挖掘技术的概念、过程及方法等进行深入分析,并对人工神经网络理论的典型模型、各种学习规则进行细致的研究与总结。重点论述了本论文中所采用的BP神经网络的数学模型、学习算法及其结构设计,为模型的构建奠定理论基础。其次,以高校规模的生均教学行政用房面积指标为背景,收集辽宁省近十年的高校相关数据,采用SAS软件中的数据挖掘模块—Enterprise Miner建立高校规模的LOGISTIC模型,对生均教学行政用房面积指标进行验证,得出其不甚合理的结论。在SAS/EM中用BP神经网络方法建立模型,网络隐含层节点数和学习率的不同会对网络模型的结果产生不同的影响,选择修正样本数据的误差均方值最小的模型作为最优BP神经网络模型。将高校分成三类,使用最优BP神经网络模型对三类高校的生均教学行政用房面积指标进行预测。最后,对BP神经网络模型进行训练,得出三类高校的生均教学行政用房面积的指标预测值。为提高模型对训练样本之外的其他数据集的可推广性,采用两种方法对网络模型进行修正,最终得出,早停止方法修正的模型总损失最小,可用于模型的推广。