基于量化关联规则挖掘的就业分析系统

来源 :上海海事大学 | 被引量 : 2次 | 上传用户:raymond20082002
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来我国高等院校毕业生的就业问题不断突现出来,原因不仅包括经济改革、高等院校扩招、教育资源紧缺、就业模式不健全等,还包括高等教育模式不适应社会要求的重要因素。深化高等教育改革、改进高校学生的培养模式已刻不容缓。普通高校需要面向社会,培养应用型人才。 本文试图通过数据挖掘技术,发现学生的受教育属性和就业属性之间的关联性,找出社会需要的应用型人才的模型,从而给决策者提供指导或数据支持,改进现有的教育模式。 关联规则挖掘是数据挖掘的重要内容之一,1993年由Agrawal等人提出了Apriori算法。目前,关联规则挖掘技术已经被应用到商业、电讯、金融、农业、医疗等领域,取得了良好的效果。 由于Apriori算法是以分析事务数据库中项(属性)与项之间联系为目标,各项的值均为布尔型,而教育信息中涉及大量的量化属性,其值为连续的离散值。后来的研究者们对Apriori算法原型进行多方面的改进和扩充,以适应不同的挖掘需要,其中包括引入部分完全性概念来处理量化属性。 本文处理的数据包括量化属性和分类属性,文中首先介绍了部分完全性方法,它可以量化由于给连续离散值划分区间而导致的信息丢失。然而直接应用该方法可能导致产生大量的相似的规则,因此文中引入了一种基于期望兴趣度的度量方法以便在规则输出后确定其兴趣度。该方法同时关注规则的泛化和特化,以识别有趣规则。 同时由于区间的划分带来了项的数量大量增加的问题,导致搜索范围增加、速度下降。因此我们设计了将待挖掘数据和项集均用位串表示的方法,以位操作(与、或、异或等)来实现项集的连接、剪枝等步骤;同时由于待挖掘数据存储空间的减少,从而避免了频繁换页,从整体上提到了搜索速度。 根据以上设计原则,我们设计了一个基于量化关联规则挖掘的就业分析系统,给出了系统总体结构、各模块的功能和详细设计、数据库模式的设计,开发并实现了大部分功能。同时进行了挖掘实验,得到了较理想的结果。
其他文献
解决各类数据库系统的异构问题是80年代中期以来数据库界的研究热点,并提出了很多的解决方案。对地理上分布的多个异构数据库,在尽可能少地影响其本地自治性的基础上,实现异构数
网络空间信息系统是当今GIS发展的必然趋势,目前的研究工作主要集中在利用Internet技术在Web上发布空间数据提供给用户浏览和使用。随着Web上空间数据量的快速增加,以及各个W
本文的重点在于研究能够适应上述并行事务处理系统的数据存储分配策略。本文首先描述了数据库并行事务处理系统的整体结构和工作原理。然后,通过考虑由关系之间的关联而导
虽然近几年来网络速度有了很大的提高,但是由于接入Internet 的用户数量急剧增加以及Web 服务和网络的固有延迟,使得网络越来越拥挤,用户浏览网页时经常会出现网页打开过慢的
随着网络的普及,Linux系统在网络服务器中得到广泛使用,它的安全性越来越受到人们的重视。 本论文首先研究了Linux系统以及运行于该系统的应用程序漏洞,分级讨论了防御对L
随着多媒体、通信技术的发展和普及,数字图像的应用和传播也越来越广泛。由于图像包含的丰富内涵远非文本所能表达,所谓“一幅图像胜过千言万语”,图像所包含信息的分析和获取成
近几十年来随着生物医学科学文献的增多生物医学信息检索已经得到了越来越多的研究人员的关注。如MEDLINE数据库2009年已经包含了超过17,000,000的生物医学文献。仅在2008年
随着计算机技术的发展和网络技术的普及,互联网已成为人们获取信息的最重要途径之一。搜索引擎技术虽然在一定程度上解决了网络上资源的定位问题,但是随着网络规模的扩大,特别是
随着Internet的快速扩展,网络安全已经成为现代计算机系统面临的最重要的问题。由于互联网络在设计、实现和使用中存在着种种安全问题,使得入侵事件不断发生。因此,入侵检测(
知识管理是组织决策支持系统的一个重要研究内容,它为ODSS提供了知识获取、共享以及重用等功能。但是,由于人们对知识的理解存在个体之间的差异,因此ODSS的知识管理存在很多