论文部分内容阅读
从国家统计局公布的数据,2015年我国高等教育毛入学率达到40%,依据马丁特罗教授提出的高等教育发展阶段划分的理论,我国高等教育进入了大众化教育阶段。虽然高校连续长达13年的本科扩招已经停止,但每年高校毕业生人数都在不断的增加。2017年高校毕业生人数达到795万人,2018年毕业生人数已经超过了800万人,连续三年高校毕业生人数突破700万人。在新时代就业发展形势下,各行业都加强对人才的重视。毕业生人数年年递增,就业市场也越来越职业化、自由化、市场化,就业之难也似乎成了常态。各高校也一直在帮助毕业生提高就业率,如召开多场专题招聘会,多场就业指导讲座等形式,可是效果一般。如今社会处于大数据时代,大数据挖掘是现当今应用比较广泛的技术,数据开发人员通过数据挖掘技术,对数据进行更深层次的探索,发掘数据的关联性,为决策者提供决策支持。随着数据挖掘技术不断成熟,在金融领域、电信业、零售业、医疗电信领域、交通领域等都得到了广泛的应用,而高校教育在这方面应用还比较滞后,特别是在高校就业当中使用的就更少。在高校学生就业信息数据分析领域,存在多年的学生就业信息,而这些毕业生就业信息数据紧紧是存在电脑硬盘里,最多只是被就业管理人员用作普通的信息查询,利用率十分低。充分发挥出高校就业工作数据的潜在力量,让就业指导工作更高效、更准确、更有个性、更有针对性为学生服务,同时为高校就业服务提供参考依据,促进高校就业工作有新举措。。本文比较和分析了几种典型的决策树算法,着重对ID3算法和C4.5算法进行了描述。ID3算法以前的决策树算法要求数据集的所有值都是准确值,缺失数据会降低算法的性能,缺失数据处理不当,就会累计大量错误,增加后续算法的运算时间和复杂度。C4.5算法尽管可以处理缺失数据,但仍然不尽完善。使用关联规则和贝叶斯算法对决策树算法进行优化。利用叶斯模型填充决策树的缺失值,然后再用决策树算法构造决策。数据来自XX学院2016届的毕业生数据进行测试。本文主要从五个部分展开。第一部分绪论,介绍研究背景、内容、框架、意义和方法,以及当今数据挖掘技术在高校就业中的应用现状。第二部分介绍了数据挖掘基本概念,以及决策树算法的概念和决策树的典型算法。第三部分和第四部分,分别用关联规则和贝叶斯规则对决策树算法进行优化,并使用数据进行测试、验证、分析。第五部分基于决策树算法的就业数据分析系统的设计,对XX学院的学生就业信息数据进行分析,验证了算法的可靠性。最后,对全文的总结和展望。对高校学生相关的就业数据进行挖掘,发现潜在规律,找出隐含的模式,为就业指导提供决策依据,从而推进毕业生就业制度改革,促进大学生就业。