基于数据仓库的关联规则挖掘算法的研究与应用

来源 :南昌大学 | 被引量 : 0次 | 上传用户:stystill
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在过去的数十年中,无论是商业企业、科研机构或者政府部门,MIS系统(Management Information System,管理信息系统)都被广泛地应用在信息管理上。以事务处理为主的MIS系统在方便数据管理的同时,也积累了海量的、十分繁杂的数据。由于爆炸性增长的数据量与相对贫乏的知识之间的矛盾,使得数据挖掘成为目前国际上信息决策和人工智能领域的最前沿研究方向之一,其中发现大量数据中项集的相关联系的关联规则(Association Rule)挖掘是它的一个重要方向。在本文中,对经典的关联规则算法进行了深入的分析和研究,并对原算法存在的不足之处,提出了一些改进方法,取得了一定的效果,研究内容主要包括;(1)改变了经典算法的单向搜索方法,运用了自顶向下和自底向上相结合的搜索策略。无论项目集数目多少或是最小支持度大小,都能够较快的找到频繁集,实验证明能提高算法的效率。(2)利用自底向上生成的非频繁项目集合来指导自顶向下的降维操作,可减少自顶向下的侯选频繁集的数量。(3)利用矩阵的结构保存事务数据库,减少计算机的I/O操作,利用事务数据库压缩存储的性质对数据进行裁减,提高了对数据遍历的效率。(4)研究了数值属性关联规则的挖掘算法,利用聚类算法来划分区间,然后将划分后的区间映射为布尔属性,最后发现用户感兴趣的关联规则。最后,将理论知识与实践相结合,以学生成绩分析数据仓库为数据源,进行关联规则的挖掘,同时以OLAP等工具对数据进行多维展现,实现数据分析的可视化。
其他文献
人脸识别作为一项典型的生物特征识别技术,涉及多个学科,例如图像处理、生理学、模式识别等,同时在国家安全、信息金融安全等范畴也具备很高的社会价值和应用前景。眼睛作为
微粒群算法是上个世纪90年代提出的一种基于群体智能理论的优化算法,通过群体中粒子间的合作与竞争产生的群体智能指导优化搜索。相比于进化算法,微粒群算法保留了基于种群的
视景仿真系统目前在我国已经广泛应用于各种研究领域,如军事仿真、城市规划仿真系统、虚拟现实房产推销系统、大型工程漫游系统和模拟训练系统等。但是仿真技术在赛场上的应
随着大数据、物联网技术的快速发展,云制造作为一种新的生产模式,日益受到制造企业的重视和青睐。在云制造环境下,工业制造过程中所产生的数据不断累积且缺乏关联,如何构建数据间的关联关系成为有效发现隐藏在数据背后的价值的瓶颈问题。数据之间的这种逻辑关联关系更多的隐含在大量单调、离散的数据背后,很少有能够直观表现出来的逻辑关系,如果无法发现它们之间的关联关系,就导致无法从这些数据中抽取出有价值的信息以及无法
随着计算机科学与技术的发展,理论、实验和计算形成了当代科学研究的三大支柱。高性能计算已经成为支撑科学研究和高新技术发展的基础性交叉学科,越来越多的科学研究和重大工程
急性低血压症(Acute Hypotension Episodes,AHE)作为重症监护(Intensive Care Unit,ICU)中一种高死亡率、高突发率的术后并发症,严重威胁着患者术后的生命安全。生理信号时间序列
随着大数据时代的到来,如何快速处理数据并从中发掘有用的信息成为目前急需解决的问题。特征选择作为机器学习和数据挖掘领域的一个重要的预处理步骤,越来越受到学者们的关注
矩阵是数值代数中的一个基本概念,许多科学计算问题往往都可以归结为对矩阵的操作。在许多应用中,需要用到较长的矩阵链相乘,例如机器人,机器控制,以及计算机动画等。矩阵链
关联规则挖掘是数据挖掘的一个重要内容,计算频繁项集是关联规则挖掘中的关键技术和步骤。这方面的算法主要代表有两类:Apriori类算法、FP-Growth类算法。Apriori类算法缺陷之
随着互联网和电子商务的快速发展,各种商业活动和人们的日常生活越来越多的依靠网络来进行,如电子现金交易、电子拍卖、电子招标和电子合同的签署等。在复杂的网络环境下,如