基于改进半监督自训练方法的高校毕业生就业预测应用研究

来源 :重庆师范大学 | 被引量 : 6次 | 上传用户:sheygy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在高校毕业生就业前进行预测分析,可以为提高大学生就业质量提供了方向,更好地衔接高校的招生、培养和就业工作。目前,各大高校建立了较为完善的学生信息,这些数据包含了学生的生源籍贯,学业状况、就业情况等具有价值的信息,能帮助高校有针对性地挖掘出就业与各个因素之间隐藏的联系。使用传统人工的方式管理这些信息,对时间、人力、数据资源有极大的浪费。随着计算机技术的发展,数据挖掘技术在教育领域的应用使得高校管理更加便捷。由于形势政策和学生群体风格差异导致不同届学生就业情况分布不能完全吻合,半监督分类方法可以利用无就业信息的毕业生样本进行训练,扩大训练集,使预测模型更符合真实分布。本研究将改进的半监督分类方法(Semi supervised)应用到毕业生就业预测中,并对预测结果进行验证。概括起来,本研究的主要工作如下:(1)分析和总结了目前高校毕业生就业指导的意义和目前就业指导工作存在的缺陷,通过建立毕业生就业预测模型来提高就业指导工作的效率。其次,阐述高校毕业生就业预测模型的意义,通过分析影响毕业生就业情况的因素,引进数据挖掘方法到高校毕业生的就业预测中,得出基于数据挖掘方法的预测模型基本流程。(2)从机器学习的视角介绍了常见的半监督分类算法,重点对半监督自训练分类算法进行了研究,并针对基于朴素贝叶斯的自训练算法在样本数量分布不佳的情况下分类器的精度低的情况,提出改进。改进算法将相似度计算方法引入到半监督自训练方法中,通过计算未标记样本与有标记样本的相似度——欧式距离及余弦相似度,筛选置信度高的样本加入到训练集中,不断迭代至训练好贝叶斯分类器进行分类。最后通过在选取相关数据集仿真实验,验证改进算法的有效性。(3)针对重庆市S高校的毕业生信息进行数据收集、数据预处理。在MATLAB环境下,利用改进的结合相似度的半监督朴素贝叶斯自训练算法,对收集到的数据集进行实验,将改进算法的预测精度和效率与其他算法相比较,改进算法优势明显,能够更好的预测未标记样本,为下一步就业指导提供参考。其次,使用构建好高校毕业生就业预测模型对待毕业生数据进行预测,分析其结果结合S高校的实际情况提出就业指导对策。
其他文献
20 0 0年 9月 ,笔者赴美国洛杉矶加州州立大学学习一年。期间 ,对美国政府高层公务员选拔管理机制进行了深入考察。考察内容包括 :美国政府高层公务员的选任方式 ,考察公务员
第一部分MRI测量子宫内膜癌病变大小与术后的对照研究目的:比较磁共振T2加权像(T2WI)和弥散加权像(DWI)定性诊断子宫内膜癌敏感性的差别和定量测量癌灶大小准确性的差别。探讨术
<正> 在西方国家,为了保障债仅人的利益,确保公司债券到期时有足够的偿还能力,明确规定债券发行公司须在债券到期以前,按期提取一定数额的偿债基金,交由银行或信托公司等保管
行业在变、市场在变,纽约展的办展理念也要变。如何通过提升展会内涵更好地服务好中国外向型企业的新型态,利用好纽约时尚中心的优势,对正在转型或以后要转型为议价能力强的企业
期刊
通过给犬胸腔注入生理盐水模拟不同量胸腔积液模型,并通过X线摄片检查,比较和分析不同量胸腔积液在不同体位下的X线表现。结果显示:不同积液量在不同体位投照时,犬胸腔积液的
组织公民行为是现代人力资源管理的研究热点,但研究视角大都局限于企业领域。文章创造性地将其引入到公共部门,运用因子分析技术,对公务员组织公民行为的结构进行了实证分析。结
本文从肾脏的生理代谢特点出发,提出以下非药物治疗慢性肾脏病的方法,旨在尽可能减少药物对肾脏的再次损伤,更好地保护肾功能和提高机体免疫功能。(1)早期预防,延缓或杜绝慢
纽约最重要且最大的年度艺术盛事之一,军械库艺术展于2015年3月在纽约曼哈顿西侧的哈德逊河的92和94号码头举行,聚集了世界上最大胆前卫的先锋艺术作品,世界各地的艺术家、收
无线传感器网络的信道资源十分有限,作为控制网络信道资源分配的MAC协议成为了研究热点。在设计MAC协议时要尽可能的考虑如何更加充分地利用有限的信道资源来完成更多的数据
通过考察审计风暴由来及其发展,2010年三公经费披露情况及其讨论,研究如何规范披露三公经费,并构建起三公经费披露的绩效审计机制,为深化和完善市场经济和民主法制建设提供思