论文部分内容阅读
高校毕业生的就业问题已经成为当前社会普遍关注的热门话题。虽然高校和用人单位都采用了专场招聘、定向招聘的方式寻找适合的毕业生人才,但仍亟需改变大学生初次就业工作与毕业专业关联度较低的现状。目前针对高校学生的画像技术研究已相继展开,通过对信息化校园的数据进行挖掘,实现学生学情预警、学生思想动态检测、图书借阅服务提升等应用,更好地促进学生的管理和服务。但是,针对学生就业方向的画像研究依然薄弱。本文研究和设计一套基于学生成绩的就业画像模型,通过实现毕业生成绩数据和就业数据的整合研究,最终给出毕业生就业方向的建议。首先,抽取某高校教务处的计算机类专业学生成绩数据与就业中心存档的毕业生就业数据,经过数据清洗获得画像属性,然后设计基于决策树的算法,对数据各个维度进行分析计算,找出与学生就业关联最大的各科课程的信息增益率,通过信息熵计算得出在校学生的能力指标结果集,分析学生的能力指标集就业方向上的占比规律,找出能力指标与就业方向的关联比例,进而建立就业画像模型。该模型可以为即将毕业的在校学生初次就业择业提供参考依据,能够有效地提高毕业生就业岗位与专业之间的匹配度。本文使用Python进行大学生就业画像系统开发,使用My SQL技术实现数据库与管理,通过成绩数据分析和聚类为即将毕业的学生贴标签,最后通过决策树算法构建画像模型。大学生就业画像系统为即将毕业的学生提供就业方向指导,帮助解决学生临近毕业时刻择业方向不确定的问题。该系统可以帮助学生和老师更加形象化地分析毕业生的能力,从而达到有目的择业就业,提高就业匹配度,提升就业质量。