基于粒度计算的数据挖掘方法的研究

来源 :沈阳工业大学 | 被引量 : 0次 | 上传用户:hwwacm
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据挖掘是一门新兴的技术,它涉及到多个学科领域的知识。数据挖掘能从大量的数据中发现一些人们事先未知的、潜在的、有趣的知识,因此又被称为数据库中的知识发现。数据挖掘有很多研究方向,关联规则是其中重要的一个。关联规则挖掘能发现大量数据中项集之间的关系,可广泛应用于购物篮分析、相关分析、分类、网络个性化服务等领域。 本文讨论了挖掘关联规则的经典算法—Apriori算法和它的一些变形算法。针对Apriori算法存在的一些问题,即在求项集的支持度时需要多次扫描数据库,以及在生成候选项集时会浪费大量的时间和内存空间,本文提出了一种基于粒计算的关联规则挖掘算—AR-GrC算法。该算法AR-GrC引入了粒计算的思想,即把事务数据库中每一个项看成一个信息粒,通过扫描一次数据库得到所有项的二进制表示,利用信息粒的“与”和“或”运算求项集的支持度。该算法的优点在于只需扫描一次数据库,利用粒计算求项集的支持度,减少了时间耗费和空间占用,从而提高了规则挖掘的效率。 但是对于许多应用,由于多维数据空间数据的稀疏性,在低层或原始层的数据项之间很难找出强关联规则。于是本文在最后提出了一种基于粒计算的多层次关联规则挖掘算法—ML-GrC算法,该算法在多层次结构中使用基于粒计算的关联规则挖掘方法来挖掘每一层上的关联规则,并且在计算高层次上项的支持度时应用了粒的层次关系。它可以发现各个层次上的强关联规则,通过提高每一层次上挖掘规则的效率来改善整体挖掘效率。
其他文献
本论文主要利用人工智能、神经网络自适应控制、寻优策略和基于Bang-Bang控制的智能开关预测控制理论对电气设备辐射电磁骚扰自动测试控制系统进行了较全面和深入的研究,取得
在计算机视觉领域,从二维图像中重建出物体的三维模型一直是学者们研究的热点,它综合了众多的学科知识,且在航空测绘、视觉导航、医学诊断、电子商务、虚拟现实等领域都有着
近年来,随着编解码技术的发展和中国移动GPRS网络,中国联通CDMA网络,以及中国电信、中国网通的WLAN无线宽带接入系统的开通,利用它们作为承载网络,进行低码率的无线视频监控
发酵过程是生物领域最具潜力的分支,生物发酵技术在现代食品、医药等高附加值加工业中所发挥的作用越来越大,在未来几年内,生物发酵将成为我国国民经济的支柱产业之一。但技术的发展是一把双刃剑,发酵技术的快速发展在为我们的生产生活带来显著改观的同时,其存在的诸多安全性问题也逐一凸显,这迫使人们对生产过程的安全性和可靠性越来越重视。因此,为了提高发酵过程的安全性和可维护性,同时提高产物质量,急切地需要对发酵过