ID3改进算法在高校就业系统中的应用研究

被引量 : 0次 | 上传用户:suease
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着高等教育规模的不断扩大,高校毕业生的数量与日俱增,就业难的问题日益突显。来自教育部公布的最新数据显示,我国高校毕业生的数量由2001年的103.4万增加到2012年的630万。为了提高就业率,决策者们很想知道如何培养学生,使其能在就业市场找到理想的工作。而高校一般都已建立了学生就业管理系统,保存有大量的毕业生就业历史数据。如何从这些数据中找出有价值的信息,辅助决策者制定策略,是我们所关心的问题。数据挖掘技术就是一个很好的解决方法。数据挖掘技术不仅可以对历史数据进行查询,而且能够找出数据之间的潜在联系,进行更高层次的分析,更好地进行决策、预测。决策树方法是数据挖掘的重要方法,通常用来分类和预测。在众多的决策树挖掘算法中,ID3算法是最经典的决策树挖掘算法。但是,ID3算法存在多值偏向的问题,使决策树性能下降。因此,本文提出了一种避免多值偏向的改进ID3算法——NEWID3算法。该算法是以属性相似度的理论框架为基础,通过对决策树中条件属性和决策属性的相似度的计算,把相似度的比值大小作为测试属性的选择标准。本文通过对NEWID3算法在实例数据集中训练得出的决策树进行分析,得出此算法能有效的提高分类的正确率,弥补了ID3算法选择测试属性时偏向取值较多的属性的欠缺。最后,为了证明NEWID3算法的实用性,本文将NEWID3算法应用于以高校就业分析为主题的数据挖掘系统中。本系统首先对数据进行预处理,使数据表中的数据更符合算法的输入要求。然后采用NEWID3算法进行数据建模,并对该模型进行评价,得出有价值的规则。最后利用验证后的模型对该高校应届毕业生的就业信息进行分析,对每个毕业生的就业层次进行预测。本系统对帮助高等院校更好的对学生进行毕业生就业指导,提高学生就业率和就业质量等方面具有重要的现实意义。
其他文献
《聊斋志异》是蒲松龄的重要代表作,作为描写妖鬼狐仙却具有浓厚现实主义的著作,小说受到了历代多数文学理论家的关注及阐释。这其中不乏诸多经典的解释,但是由于历史现实以
自动化测试就是把人手工驱动的测试动作转化为计算机执行的一种测试方式,目的是减少手工测试带来的重复性工作,节省测试时间,提高工作效率,并最终保证软件的质量。但是这些测试工
随着我国经济的发展,居民收入水平不断提高,居民的消费结构发生了巨大变化,对轿车的市场需求越来越大。论文在已有研究基础上,深入分析收入因素对轿车销量的影响路径。利用现
与传统单跨的双塔悬索桥相比,三塔悬索桥可以大大减小主跨跨度,显著减小主缆拉力及锚碇规模,其综合造价随之降低,因而在大跨度桥梁建设中具有竞争力。但是大跨度三塔悬索桥由于中
2007年度贵州广播电视奖评选,由我编导的电视专题节目《东方踢踏舞——阿妹起头》获得了一等奖,后来该节目又获得贵州新闻奖二等奖。回首节目的采访过程,有许多值得记忆的东西。
本文以较大量的临床病例(收治戒烟者639人),证明针刺可以戒烟.至于针刺戒烟的机制,本文认为是针刺可增加体内“内腓肽”的分泌,内腓肽能解除工作之压迫感和全身不适,并认为,
随着集装箱运量迅速增长,集装箱堆场使用越来越紧张。为了能够缓解车站、港口、物流中心出现的堆场使用瓶颈现象,提高集装箱堆场作业效率迫在眉睫。集装箱堆场堆放模式大致有
基于对既有国际关系和广义社会科学中关于系统、结构以及能动者—结构研究的批判性思维,作者认为国际系统通过六大各具特色且相互作用的渠道影响着国家。这六个渠道分别是:纯
视觉传达设计师早就被告知形式、结构和风格是信息交流中不可或缺的工具。随着平面设计专业的进步,竞争越来越激烈的国际市场希望可以检测创新资金的使用结果。希望设计人员