数据仓库技术在高校招生就业决策中的应用研究

来源 :北京工业大学 | 被引量 : 1次 | 上传用户:zenghui_yan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着科技的发展,社会已进入大数据时代,人们对信息的价值越来越重视,数据仓库的重要性达到了空前的高度。数据仓库是以数据库的技术为基础,在当下需要研究大量、多源、异构、动态的海量数据中,日益发展起来的。当下就业形势日益严峻,全国各个高校对招生就业的问题引起高度重视,学生选择高校的意向是什么,哪些专业的学生在什么样的工作部门就业率高,都是值得我们关注的焦点问题。本论文围绕如何更好地指导招生就业管理和决策提出一系列的问题,利用OLAP以及数据挖掘两项技术开展对论文数据的分析研究。首先,为了更好的、更合理的对数据仓库进行设计,本文运用了三种设计模型,分别是:物理模型、概念模型以及逻辑模型。同时,为保障数据仓库的顺利建立,本文处理了招生和就业两大系统的数据源,对招生和就业数据分别进行了抽调、转换、清洗、加载等工作。其次,本文在熟悉了解招生就业业务流程的基础上,针对录取情况、生源质量、各专业增减生源的数量以及各年龄层的招生就业数据仓库进行分类分析和OLAP处理,从而获得了更具说服力的结果。第三,为探寻招生就业数据仓库中各数据的内在联系,本论文利用三种数据挖掘算法,包括关联分析、决策树分析和聚类分析进行数据挖掘,主要对决策树分析进行了属性值空缺和简化熵算法的优化和改进,分析得出函授站点、录取年份、学历层次、成绩档次、文化程度及报到注册率之间都存在关联。统计分析以上OLAP处理和数据挖掘的结果,最终对高校招生就业决策提出了建议及策略。本文的研究将数据仓库技术应用在招生就业领域,从众多历史数据中发现了各种潜在的有价值的规则,从而进一步科学地指导就业、高效地开展招生宣传,这将有助于提高高校招生的质量以及毕业生就业质量,对整个高校的发展、提高生源人才质量具有重要的实践意义。
其他文献
职业教育需面向社会需求办学,开发实施以市场用人需求为导向的岗位对接课程,对增强职业教育学生综合竞争能力、增加就业有重要意义。基于金桥电子商务产业园的岗位对接课程的
易地扶贫是对生存生活条件差、发展基础薄弱,以及生态环境承受能力不足、开发受限农村贫困地区的建档立卡贫困人口实施的重要帮扶措施。通过易地搬迁,特困地区贫困人口移民脱贫效果明显,但同时也出现一些地方移民就业和收入不稳定的现象。早在本世纪初,中国就开始在一些贫困地区实施有针对性的易地扶贫搬迁试点项目工程,扶贫搬迁工程作为脱贫攻坚工作中的一个重要举措,在攻克贫困难题中取得了显著的成果。但是,移民并不等于脱
世界工会联合会(World Federation of Trade Unions),简称世界工联(WFTU),于1945年10月3日正式成立,其创立和发展实现了国际工人阶级和工会组织的团结统一。苏东剧变之前,世
钢轨是铁路建设中非常重要的一项设备,只有保障钢轨建设安全,才能够在铁路施工建设中将对应的施工管理因素落实到施工技术的应用中。而钢轨在施工技术的应用中,经常将打磨技
马球活动是西域历史马上文化的重要组成部分, 通过对历史上西域马球活动的比赛规则、场地、比赛用马等具体传承载体的分析, 从专业技术的角度为西域马球文化活动的历史定位提
水稻草状矮化病毒(Rice grassy stunt virus,RGSV)和水稻锯齿叶矮缩病毒(Rice ragged stunt virus,RRSV)均由褐飞虱(Nilarparvatalugens)以持久的增殖性方式传播。褐飞虱是水
在时间、歌声幅度、歌声频率三维坐标中,歌声展现的是声波的频谱沿频率轴衰减的同时沿时间轴起伏延伸构成的曲面;也是每个音符的幅频特性包络线沿时间轴延伸构成的曲面。坐标和
汉字作为中国最具有代表性独特的元素符号之一,已经被大多国内车企所运用到品牌汽车的形态设计当中,并取得了一定的成功。汉字作为一种符号,其具有符号特有的能指与所指相结
为建立大跨度混合梁斜拉桥的耐久性失效风险评估体系,在分析耐久性和风险已有定义的基础上,从评估角度明确了耐久性失效风险的相关概念.考虑耐久性时间跨度大的特点,通过调研
<正> 在应用回归分析中,最伤脑筋的问题是如何挑选解释变量,可以说是回归分析的一个老大难问题,至今仍未得到很好的解决.举例说明,人们知道,肺癌的发生率 y 与吸烟量 x1之间