基于粗集理论的关联规则挖掘的研究

来源 :广西大学 | 被引量 : 0次 | 上传用户:lyh993
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着数据库技术的不断发展及其广泛应用,数据库中的数据量急剧增大,当大量数据不停地被收集和存储,业界人士对他们数据中项集之间的相关联系越来越感兴趣。这种数据中项集之间的有趣的相关联系称为关联规则。如今,关联规则已广泛应用于各个领域,如:医疗诊断,市场分析等。而算法效率不高、规则冗余度较大、用户仅对一部分关联规则感兴趣是目前关联规则挖掘算法普遍存在的问题,因此,从大量的数据中迅速挖掘用户感兴趣的关联规则,具有重要的现实意义。 本文主要研究了以下几个方面的内容: (1) 一种新的数据挖掘理论工具-粗糙集; (2) 一种数据预处理技术-决策表的泛化; (3) 基于粗糙集理论的关联规则挖掘系统的开发; 论文首先概述了数据挖掘基本原理,总结了现有的数据挖掘技术。通过对粗糙集理论的研究,阐明了粗糙集理论是一种尤为适用于不确定、不完整系统的数据挖掘的数学工具。在此基础上,重点探讨了粗糙集理论的属性约简方法。随后,讨论了数据预处理阶段属性值的泛化问题。最后,阐述了基于粗糙集理论的关联规则挖掘原型系统的设计和开发工作,其中,详细说明了在经典关联规则挖掘Apriori算法基础上改进后的算法的思想和步骤。并将原型系统作用于实验数据库,获得了较好的结果,证实了原型系统具有一定的实用价值。 本文的研究工作是一个尝试,有待于进一步的深入研究。
其他文献
数据库中的知识发现(Knowledge Di scovery in Databases,简称KDD)是数据库和人工智能领域研究的热点课题,其目的是在数据库中提取隐含的,先前未知的,潜在有用的知识。数据挖掘领
近年来,专家系统技术已广泛应用到工业、农业、军事、医学以及国民经济和社会生活的各个方面。将专家系统的研究应用于产品的可制造性分析中,利用它指导产品设计,对于提高产品质
随着互联网的迅速发展以及移动信息时代的到来,信息化正在潜移默化的改变着人们的生活,然而在改变人们生活的同时,各种信息化产物也在不断的产生海量的数据信息文件,因此也给数据
人类获取外界信息的绝大部分来自视觉,所以数字图像成为人们生活交流的重要载体之一,但是数字图像在采集、保存和传输过程中却存在很多问题。首先,传统图像在保存和传输时可能出
如今互联网已经成为了人们获取信息的重要途径之一,每天数以亿计的文本信息在互联网上被发布和传播,给用户准确获取自己需要的信息增加了难度。利用自动摘要技术为互联网上的这
互联网包含有海量网页,越来越多的用户通过搜索引擎寻找特定信息。Web信息检索的目的是在网页集合中找到与用户查询相关的所有网页,而网页评估算法将对这些网页进行评估后显示
本论文对目前的JDO技术规范进行了研究和探讨。在介绍JDO技术规范的历史形成和体系结构的基础上给出了它的各种生命状态及其在生命状态中的主要转换过程。目前关系数据库管理
近年来,信息革命促使制造业向全球方向发展,使现代企业呈现集团化、多元化的发展趋势。这些企业需要及时了解各地分公司的生产经营状况,同一企业不同部门、不同地区的员工之间也
人脸识别技术是模式识别和机器视觉领域最富挑战性的研究课题之一,它在刑侦破案、证件验证、门禁系统、视频监视等领域中都有广泛的应用前景.该文主要研究静止图像的人脸识别
分布式计算是一种把需要进行大量计算的工程数据分割成小块,由多台计算机分别计算,在上传运算结果后再统一合并得出数据结论的科学.目前已有许多模型,如CORBA,DCOM;RMI;Web S