关联规则挖掘在学生生源质量分析中的应用

来源 :云南大学 | 被引量 : 0次 | 上传用户:aswe19
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
KDD(Knowledge Discover in Databases)是目前人工智能和数据库相交叉的一个热门研究领域,已受到不同领域研究者越来越多的关注。数据挖掘(DataMining,简称DM)是KDD的一个十分重要的组成部分,其内容涉及各种知识模式的提取算法。关联规则是数据库中存在的一种十分有用的知识模式,其挖掘算法得到了较为广泛的重视和研究,并取得了较大的进展,Apriori算法是一种寻找事务数据库频繁项集的经典算法。在现实生活中还存在很多关系数据库,对于这些多维关联规则的挖掘也是我们感兴趣的。 在任何一所高校中,往往都积累有各届毕业生生源特征资料、高考的成绩数据,以及大学的各门课的成绩。如果能对这些数据进行关联规则挖掘,寻找出考生的各种因素与学生所学各门专业课程之间的关联关系,进而研究考生生源特征与专业方向的关系,从而能指导学校的招生和学生填报志愿等工作。 本文结合某高校学生关系数据库数据挖掘的具体应用,对关系数据库的关联规则的挖掘步骤和方法进行了探索,同时把一种Apriori的改进算法应用于高校考生生源关联规则挖掘之中,并给出了具体的编程。本文所做的主要工作如下: 1. 论述了数据挖掘应用和关联规则挖掘的基本方法; 2. 基于对Apriori算法的分析,采用该算法的一种改进算法有效地在实际运用中提高了产生频繁项集的效率;同时也对关联规则的输出算法进行了一点改进的尝试; 3. 在某高校学生关系数据库中实现了关联规则挖掘。具体工作包括:应用实例的分析、从原始数据收集到数据的预处理的实现,以及关系数据库到事务数据库的转换;实现了利用Apriori算法的改进算法寻找频繁项集、输出挖掘到的有选择关联规则,总结了在实际应用中实现关联规则挖掘的一些问题及解决办法。
其他文献
未来的实时系统将具备多种能力,包括分布式处理、多媒体处理、实时控制、后台信息处理等。这类实时系统将在未来的信息社会中发挥着更为重要的作用,成为最主要的应用之一。它
文字生成来源鉴定是司法鉴定的重要组成部分。尤其是计算机辅助鉴别,在文字鉴定大量筛查和疑难文字鉴定中发挥着重要作用。随着计算机技术的发展,对文字生成来源的计算机辅助鉴
表面质感建模与绘制是计算机图形学的重要研究课题,也是真实感绘制技术中的核心课题之一.这个研究课题的主要内容是让计算机可以真实地模拟自然界中物体的外观.本文提出了基
城市自来水营销管理信息系统作为一套完整的营销管理系统,包括基础信息管理、抄表管理、收费管理、表务管理、信息查询、报表中心、系统维护、银行接口等子系统。系统基于Win
本文根据嵌入式系统的特点和发展趋势,设计与实现了一款基于ARM9的可重构嵌入式开发平台,它为构建各种特定用途的嵌入式系统提供了一个完整的软硬件开发环境。平台采用核心板与
Java并行应用通常需要处理大量的数据和复杂的工作流。Java虚拟机(Java VirtualMachine,JVM)正成为影响Java系统性能的关键,在单JVM性能提高达到极限时,构造多JVM的计算环境将是
随着web环境中的应用形式向开放、动态的模式转变,授权者需要在对请求者不熟识甚至陌生的情况下自主地做出访问控制决定,传统的授权机制不能很好地适应这种情况,信任管理这种新
当前,嵌入式技术的应用正以飞快的速度扩展到各个领域,嵌入式技术本身也得以长足的发展,其中嵌入式操作系统的发展尤为突出,出现了一些优秀的开放源代码的操作系统,如Linux
随着电网建设的步伐加快,电力企业的电网结构日趋庞大,采用传统的方式管理电网已经难以满足管理与业务需求。运用现代计算机管理手段,大力开发和利用企业的信息资源建立管理信息
随着互联网和分布式技术的发展,传统关系型数据库已经不能满足现有应用对大数据存储、高并发、高吞吐量、低延迟方面的要求,分布式顺序表应运而生。现有分布式顺序表都是以磁盘