论文部分内容阅读
高等教育扩招政策的推行,使得高校毕业生人数连年大幅增加,而与之相对应的大学生就业情况却不容乐观。虽然教育信息化的推进使得高校就业指导系统中积累了大量学生信息,包括各种在校数据以及相关就业数据,但是在实际应用中,这些数据并未得到充分利用。数据挖掘技术作为由多种学科交叉而成的新兴的信息处理技术,能够有效挖掘数据背后的价值。把该技术应用到高校就业工作当中,挖掘学生信息数据背后隐含的知识和规则,不仅丰富了数据挖掘相关理论的应用,而且能够为高校就业指导工作提供有力的决策支持,具有重要的理论和实践意义。本文基于数据挖掘的思想,以XXX学院教育技术学专业近三年硕士毕业生的相关数据为研究对象,采用经典的C4.5算法,构建了大学生“是否能顺利就业”和“就业地区”决策树预测模型,具体研究内容为:(1)大学生就业预测模型数据准备以及各影响因素的相关性分析。通过文献分析法,对影响大学生就业的相关因素进行梳理,在此基础上确定数据库来源,进行信息数据采集、集成、转换、清理等一系列预处理过程,形成规范的数据集,并采用相关分析法对各影响因素与预测属性之间的相关关系进行量化分析,选择出可用于预测模型构建的重要测试属性。(2)大学生就业预测模型的构建。基于经典的决策树C4.5算法,以形成的规范数据样本为挖掘对象,构建了大学生“是否能顺利就业”和“就业地区”两个决策树预测模型,并根据构建的就业预测模型提取相应的分类规则。(3)大学生就业预测模型的评估及应用分析。对预测模型的预测准确度和影响因子进行了分析;并基于预测模型,对2018届毕业生的相关就业情况进行了案例分析,为大学生就业提供了相关决策和建议。论文构建的两个大学生就业预测模型的预测准确度均在85%以上,符合预期设计;通过对预测模型进行因子分析得到:影响大学生是否能顺利就业的重要因素是“成绩”和“干部情况”,影响大学生就业地区选择的重要因素是“生源信息”和“职位匹配”。论文的创新之处是:提出了采用相关分析法进行属性筛选,保证了预测模型构建的科学性;研制了预测工具,提高了预测模型构建的效率;把数据挖掘的相关理论技术与大学生就业问题进行了有机结合,提供了一套可供借鉴的应用模式。