基于决策树算法的高校就业数据分析

来源 :景德镇陶瓷大学 | 被引量 : 2次 | 上传用户:logan_lxh
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
从国家统计局公布的数据,2015年我国高等教育毛入学率达到40%,依据马丁特罗教授提出的高等教育发展阶段划分的理论,我国高等教育进入了大众化教育阶段。虽然高校连续长达13年的本科扩招已经停止,但每年高校毕业生人数都在不断的增加。2017年高校毕业生人数达到795万人,2018年毕业生人数已经超过了800万人,连续三年高校毕业生人数突破700万人。在新时代就业发展形势下,各行业都加强对人才的重视。毕业生人数年年递增,就业市场也越来越职业化、自由化、市场化,就业之难也似乎成了常态。各高校也一直在帮助毕业生提高就业率,如召开多场专题招聘会,多场就业指导讲座等形式,可是效果一般。如今社会处于大数据时代,大数据挖掘是现当今应用比较广泛的技术,数据开发人员通过数据挖掘技术,对数据进行更深层次的探索,发掘数据的关联性,为决策者提供决策支持。随着数据挖掘技术不断成熟,在金融领域、电信业、零售业、医疗电信领域、交通领域等都得到了广泛的应用,而高校教育在这方面应用还比较滞后,特别是在高校就业当中使用的就更少。在高校学生就业信息数据分析领域,存在多年的学生就业信息,而这些毕业生就业信息数据紧紧是存在电脑硬盘里,最多只是被就业管理人员用作普通的信息查询,利用率十分低。充分发挥出高校就业工作数据的潜在力量,让就业指导工作更高效、更准确、更有个性、更有针对性为学生服务,同时为高校就业服务提供参考依据,促进高校就业工作有新举措。。本文比较和分析了几种典型的决策树算法,着重对ID3算法和C4.5算法进行了描述。ID3算法以前的决策树算法要求数据集的所有值都是准确值,缺失数据会降低算法的性能,缺失数据处理不当,就会累计大量错误,增加后续算法的运算时间和复杂度。C4.5算法尽管可以处理缺失数据,但仍然不尽完善。使用关联规则和贝叶斯算法对决策树算法进行优化。利用叶斯模型填充决策树的缺失值,然后再用决策树算法构造决策。数据来自XX学院2016届的毕业生数据进行测试。本文主要从五个部分展开。第一部分绪论,介绍研究背景、内容、框架、意义和方法,以及当今数据挖掘技术在高校就业中的应用现状。第二部分介绍了数据挖掘基本概念,以及决策树算法的概念和决策树的典型算法。第三部分和第四部分,分别用关联规则和贝叶斯规则对决策树算法进行优化,并使用数据进行测试、验证、分析。第五部分基于决策树算法的就业数据分析系统的设计,对XX学院的学生就业信息数据进行分析,验证了算法的可靠性。最后,对全文的总结和展望。对高校学生相关的就业数据进行挖掘,发现潜在规律,找出隐含的模式,为就业指导提供决策依据,从而推进毕业生就业制度改革,促进大学生就业。
其他文献
武术作为中华民族传统文化中的一个重要组成部分,具有健身、娱乐、自我防卫的作用,同时武术是中国的国粹之一,它体现和弘扬了中华民族传统优秀的精神品质,教给人们自强不息,
墨西哥女性画家弗里达·卡罗并不属于特定的艺术流派,却被女性主义、超现实主义等流派拉入了各自的阵营中。不可否认,弗里达作品风格确实与超现实主义绘画有相似性,但其在本
采用衬Halar离心萃取机处理癸二酸生产废水,介绍了离心萃取机的结构、技术参数和工作原理;对离心萃取机为满足热衬Halar工艺的要求所做的结构改进进行了说明。工程应用结果表
猪肉价格为什么会暴涨?从生猪供给的角度来看,非洲猪瘟影响生猪的供给和流通。自2018年8月3日辽宁沈阳确诊第一例“非洲猪瘟”开始,非洲猪瘟陆续在全国蔓延。根据世界动物卫生组
报纸
通过分析GSR无线节点技术在地震勘探项目的应用实例,对GSR采集仪器的优缺点做出了客观的评价,并总结出GSR节点设备的优势和适用特点,为以后在野外推广应用提供可借鉴的经验。
相山铀矿田是我国著名的大型火山岩型热液铀矿田。近年来矿田在矿产勘查和科研方面取得了较大进展,在成矿规律与找矿预测中取得了重大成就。笔者在系统收集前人成果资料的基
2015年3月调查了海南省海口、琼海、万宁、儋州等市(县)的辣椒炭疽病的发生与病情,对采集的样本分离出的7株纯菌株进行了致病性测定及形态学观察,通过生长速率法及孢子萌发抑
目的探析荨麻疹患者临床特征与护理干预效果。方法 50例荨麻疹患者,随机分为观察组和对照组,每组25例。对照组患者采用常规护理,观察组患者采用护理干预,比较两组荨麻疹患者
运用问题教学法,通过设计问题、创设问题情景激发学生探究学习的兴趣,培养学生的探究能力。
本课题针对量子点光转化LED器件(QCLED)发光效率低,封装结构优化适用范围小等现有技术难题,首先对最常见的量子点光转化涂层(QCC)的基础参数进行了实验学习,主要基于重吸收问