【摘 要】
:
关联规则挖掘实数据挖掘领域中的一个非常重要的研究内容,其主要目标就是发现数据库中一组对象之间某种有趣关联或相关联系。近年来,关联规则挖掘研究称为数据挖掘中的一个热
论文部分内容阅读
关联规则挖掘实数据挖掘领域中的一个非常重要的研究内容,其主要目标就是发现数据库中一组对象之间某种有趣关联或相关联系。近年来,关联规则挖掘研究称为数据挖掘中的一个热点,并被广泛应用于市场营销、事务分析等领域。以往的许多研究都将关联规则视为永恒有效的,没有考虑到规则的变化,这种规则是一种静态的规则。实际上,数据特性和规则可能都会随着时间的推移产生很大的变化,因此,实时维护规则的有效性显得尤为必要。本文对经典关联规则挖掘算法进行了系统的研究和全面的总结,在此基础上提出了基于动态数据的新关联规则挖掘及更新算法,通过数据挖掘系统平台进行了算法的设计与实现。本文首先介绍了数据挖掘的基本任务和技术,重点介绍了关联规则挖掘的三种经典算法:Apriori算法、close算法以及FP-Growth算法。并对Apriori算法的改进、FP-Growth算法的优缺点进行了全面综合的分析。其次,本文详细介绍动态数据关联规则算法核心思想,体系结构,算法挖掘的基本步骤以及算法的伪代码实现。对算法的特点和关联算法性能评价标准进行了全面而细致的描述。最后,在对关联规则挖掘算法进行分析和总结的基础之上,利用数据挖掘服务软件系统实现了动态数据关联规则挖掘算法的设计与封装,并且进行了算法的性能测试。通过实验性能结果我们可以知道该算法挖掘效率更高,通过相应的评价指标充分考虑了动态数据的时间特性,非常适合于面向主题的动态数据挖掘,具有良好的可扩展性。
其他文献
在现代工业生产系统和其他领域,信息技术的发展为各行各业注入了新鲜的血液,提供了新的活力和驱动力,可以说IT软件系统无处不在,无所不能,已经成为了支撑社会运转的重要平台
企业信息化发展到一定程度,在应用如ERP、SCM、CRM等业务系统过程中,产生并积累了各种大量数据,不同应用所形成的数据更容易形成信息孤岛。如何充分利用不同业务部门的详尽数
模型驱动体系架构(MDA)是一种新的软件开发框架,它的目标是把业务和应用逻辑与底层的平台技术分离。统一建模语言(UML)是MDA的核心标准之一,用于描述计算无关模型(CIM)、平台无
随着互联网的爆炸性增长,Web已经发展成为站点遍布全球的巨大信息服务网络,根据CNNIC统计,截至2008年底,仅中国网页总数就超过160亿个,较2007年增长90%。网页的增长速度与网
在电子商务的发展进程中,如何准确地理解用户访问网站的行为是十分必要和有意义的,Web日志挖掘是解决该问题的重要研究方法之一。发现用户的兴趣访问模式是Web日志挖掘的一个
随着互联网的飞速发展,信息指数级的增长给人们快速有效获得有用信息带来了巨大的挑战,网站是比网页更高层次的抽象,网站聚类作为web挖掘的重要分支已经得到越来越多的关注,
近年来,社交媒体的快速发展极大程度上影响了人们的日常生活和信息分享方式,特别是新浪微博这类社交媒体的兴起,使得传统人际交往从线下方式转移到线上,大量用户的使用,产生
社会管理综合治理应用系统定位于面向综治部门及综治成员单位,依托政法信息网,以成员单位社会管理数据为基础,融合专项组成员单位社会管理相关业务,构建纵向到底、横向到边,多级相
近年来,随着互联网和信息行业的蓬勃发展,大数据受到越来越多的关注。对于医疗行业而言,日常运营中产生、累积的大量数据中往往蕴含着许多关键的信息。通过对海量数据的数据分析与数据挖掘获取信息,也成为医院管理者顺应现代化潮流、提高管理水平和工作效率、实时掌握医院经营动态的必不可少的管理途径。而药品作为医院经营的重要一环,对药品数据的分析可以极大地辅助管理者的决策。基于这一点,提出了面向医院药品的数据分析的
随着网络应用的广为普及,园区网规模不断扩大,承载的业务越来越多样化,导致网络设备超负荷运转,从而引起网络性能下降。现有的网络管理系统能够获取网络中每个设备的各活动接