关联规则挖掘算法研究和应用

来源 :太原理工大学 | 被引量 : 5次 | 上传用户:superheron
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据挖掘是从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程,其主要目标是从大型的数据库中挖掘出对用户有价值的模式。在事务数据库中挖掘关联规则是数据挖掘领域中一个非常重要的研究课题。本文对数据挖掘技术,尤其是关联规则数据挖掘技术进行了系统、深入、全面、详尽地分析和研究,主要包括以下一些内容:第一、数据挖掘技术的分析与研究。在数据挖掘基本概念的基础上,对数据挖掘常使用的技术和研究的对象进行了详细地分类、归纳和总结,对数据挖掘技术的国内外研究现状进行了广泛而全面地归纳和分析,对数据挖掘技术的未来发展趋势和热点研究领域进行了总结和探讨。第二、关联规则数据挖掘技术的分析与研究。在介绍关联规则基本概念的基础上,对关联规则的Apriori算法进行了详细地分析和研究,并就目前针对提高该算法效率的各种优化技术也进行了详细地描述。第三、提出一种从大型数据库中挖掘关联规则的改进算法LApriori算法,该算法以经典的Apriori算法为基础。文中给出了新算法的理论依据,以及整个算法的思路,该算法与Apriori算法相比具有如下特点:(1)对整个数据库只需访问一次;(2)k-频繁项目集的挖掘可通过(k-1)-频繁项目集得到,而无需再次扫描数据库;(3)采用二进制的存储方式将节省大量的存储空间,二进制的运算速度也可以节省大量的时间。理论分析表明,改进后的LApriori算法的应用效率高,实验结果也表明改进后的算法效率高,而且随着数据库规模的扩大,效率提高更加明显。第四、将改进算法应用到车辆违章数据挖掘中。
其他文献
随着Internet和多媒体技术的迅速发展产生了大量的数字图像库,基于内容的图像检索技术(CBIR)应运而生,但在实际应用CBIR系统中发现,用户必须提供一幅待查询的图像,再通过对待
作为Web技术的提升和发展,语义Web代表了下一代Web的发展和趋势。语义Web将赋予信息资源更明确、更完备的语义信息,使得计算机能够理解Web资源,因而实现Web数据和Web服务处理的
随着计算机技术的发展,信息化已经成为各个产业的必然需求。而且人们对信息的获取、加工、处理的要求越来越高,传统的操作型数据库已不能满足管理者决策分析的需求。数据仓库(D
XML迅速的成为Internet上用于数据表示和数据交换的标准。XML文档大量涌现,XML的有效管理受到广泛关注。为了结合数据库发展的需要,我们研究了在关系数据库中存储和查询XML文档
网盘作为一种新兴的云存储服务,能依靠本地客户端自动将用户设备上的文件储存到云端,并通过云服务在多个设备之间进行文件同步。然而,现有的网盘服务在网络性能、服务可靠性
Web的信息资源和信息服务的数量和复杂度都以惊人的速度增长着,一个站点能否吸引访问者,能否成功地引导访问者获得有用的、恰到好处的信息,成为这个站点是否能够成功的关键。这
随着对高性能计算资源的需求增长,使用云计算环境下的虚拟集群来运行紧耦合的并行应用变得越来越流行。然而在虚拟化环境下,会发生锁持有者被抢占问题。当虚拟机中占有锁的虚
对于许多实际应用,稀有类分类问题都非常重要。而稀有类样本的数量稀少使得很难使用传统的分类器对它们准确分类。由于稀有类问题的特殊性、复杂性及难解性,目前研究稀有类问题
本硕士论文所反映的研究工作是在四川省网络通信重点实验室的分布式多端口并发测试技术和测试系统的基础上展开的。传统的针对路由器的测试方法,如ISO 9646定义的穿越测试法,已
随着市场经济的快速发展,企业联系日益密切,社会分工也日趋细腻,物流业已成为国民经济中一个重要的产业,而物流业中仓储管理已是影响物流效率与质量的重要部分。物流业的发展促使