论文部分内容阅读
提高学校的就业率与学生的就业质量,是今年来社会关注的热点内容。传统学生就业信息没有被充分利用,只是完成了简单的存储查询功能。为了挖掘利用学生就业信息,寻找其中存在的规律,从而更好的指导未来的教育教学工作,本文重点研究对学生就业信息数据的数据挖掘工作。本文主要分为五个部分。第一部分为引言部分,主要介绍了数据挖掘技术的热点内容和关键技术点,并详细了解了国内外对于此技术的研究进展情况。第二部分为算法介绍部分。主要介绍了数据挖掘现有的主要技术及算法。其中包含决策数据算法、关联规则算法和贝叶斯算法。针对决策树分析算法、关联规则算法、贝叶斯算法,通过实例阐述了各算法的实现步骤。最后对3种算法进行了详细的优缺点分析对比以及使用范围。第三部分为主要介绍了基于关联规则的决策树分析算法。算法总共包含预处理、关联规则处理、决策树分析处理和整合分析处理等几个步骤。预处理中主要完成对数据的整合、扩展、离散化等步骤,目的是将不同形式的数据整合成0与1组合的形式,方便后续算法的处理,并剔除其中异常部分。关联规则处理部分将企业属性划分成多个层次,并针对每个结果进行了关联规则分析,最终得到每个属性的强关联属性。通过决策树分析方法,构建出决策规则,从而构建起了决策树模型将学生属性与企业属性之间隐藏的关系挖掘出来,达到了数据挖掘的目的。最后通过整合,将多个属性的结果融合在一起。第四部分主要构建了学生就业信息的模型。详细介绍了数据收集和数据模型建立的过程。第五部分针对一组学生就业信息数据,通过基于关联规则的决策树分析算法进行分析,验证了算法的可靠性。最后,对全文做了总结,并对未来工作做了规划。基于关联规则的决策树分析方法能够有效的挖掘出学生就业信息数据中隐藏的信息,对指导高校的教育教学和学生的自我规划有着重要的帮助作用。该算法具有运行效率高,结果稳定等特点,对于其他类型的数据挖掘也有着积极的作用。