论文部分内容阅读
随着高等教育的招生人数的逐年加大,毕业生人数也随之增多,毕业生面临的就业压力也逐渐增大,因此查找影响毕业生就业因素,使毕业生更好的就业显得格外重要。高校虽然在毕业生就业管理信息系统中拥有大量的毕业生数据,但是不能挖掘出毕业生信息和毕业生去向之间的关系,而数据挖掘技术去能做到这一点,采用数据挖掘技术队毕业生的信息进行挖掘,发现毕业生信息和毕业生就业去向之间的关系,为毕业生的就业提供重要的理论依据,使得毕业生更能利用好时间充分去弥补自己的缺陷和不足,为将来的工作建立一个好的理论支持。数据挖掘是从海量的数据中发现隐藏的但是有价值的信息的过程。数据挖掘技术已经在很多领域都得到了良好的应用,包括医疗、零售、金融、保险等,而在教育领域的应用还没有得到良好的应用。本文就是将数据挖掘技术应用到教育领域,探讨毕业生信息和毕业生就业去向之间的关联。数据挖掘技术包括很多算法,主要有以下几种:决策树算法、神经网络算法、关联规则算法、统计分析方法和模糊集方法等,每一种方法都有各自的优点和缺点,他们适用的范围和对数据的处理也不一样,因此我们针对不同的对象和数据要采用不同的方法。本文对这几种方法都进行了详细的阐述,并且对不同的算法的特点也进行了大体的探讨。本文根据毕业生数据的特点选用了决策树算法,因此本文还对决策树算法进行了详尽的描述,决策树算法主要包括ID3算法和C4.5算法,它们是决策树算法中应用比较广的算法,ID3算法采用信息增益的方式建立决策树,而C4.5对ID3算法做了进一步的改进,采用信息增益率的方法建立决策树,使得建立的决策树更准确。本文在这样的背景下,详细阐述了数据挖掘的研究现状以及数据挖掘技术的相关理论,并且对本文所采用的C4.5决策树算法进行了详细的描述。在这些理论基础之上,本文用C4.5算法对毕业生的就业信息进行挖掘,最后生成决策树以及分类规则的方法直观显示挖掘结果,为毕业生的就业提供理论支持。本论文最后对该课题的研究进行了总结和展望,总结了本文的研究内容并且对该课题未来的发展作了展望。