数据库中Burst模式挖掘的研究与实现

来源 :广西师范大学 | 被引量 : 0次 | 上传用户:wewe11111
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近十几年来,随着科学技术的不断发展,人们产生和收集数据的能力迅速提高,因而数据规模急剧增加,仅仅依靠现有的技术是很难分析这些海量数据的,于是出现了“数据爆炸但知识贫乏”的现象。人们希望能够有新的工具自动的分析和整理如此庞杂的数据,从中发现有价值的东西,为决策提供必要的支持。面对这一挑战,数据挖掘技术应运而生了。数据挖掘技术是指从大量的、不完全的、有噪声的、模糊的、随机的数据中抽取出潜在的、有效的、新颖的、有用的和最终可以理解和运用的知识的过程,它是涉及数据库、人工智能、统计学等众多学科的一个非常活跃的研究领域。数据挖掘不仅吸引了众多学者为其投入极大的热情,同时也引起了产业界人士的广泛关注。数据挖掘有许多功能,比如关联分析、聚类分析、例外分析等,其中例外分析也称例外模式挖掘,它是数据挖掘的一个重要研究课题。一个数据库中的数据一般不可能都符合分类预测或聚类分析所获得的模型,那些不符合大多数数据对象所构成的模型的数据对象被称为异类(Outlier)或例外(Exception)。以前许多数据挖掘算法在正式进行数据挖掘之前都把例外对象当作噪声而将其排除在数据挖掘的分析处理范围之外。但是从知识发现的角度来看,在一些应用场合,如电子商务欺诈行为的检测,银行信用卡欺诈行为的检测等,那些很少发生的事情往往比经常发生的事情更有趣、更有研究价值。因此,例外模式挖掘是一项重要且有意义的研究工作。本文提出了一种新的例外模式——Burst模式的定义,这种模式只在单个或者少数几个特定的时段或数据库中出现,并且在本阶段或者本数据库中相对其他模式而言有很高的支持度。这种模式支持度高,说明它们在各自的时段或数据库中很频繁;而它们又只有少数几个时段或者数据库支持,这就说明它们是特有的。那么这种模式就可以给公司或企业的决策者在做决策的时候提供支持和帮助。公司可以根据它们的特殊性制定出特殊的决策,加快公司的发展,提高公司的利润。因此,如何有效地在数据库中挖掘Burst模式就成了一项很有意义的研究工作。本文第一章首先简要介绍了数据挖掘的基本概念、功能和面临的挑战;第二章详细介绍了与本文密切相关的关联规则挖掘的问题、方法和技术;接着在第三
其他文献
创建安全的Web应用程序是一项极具挑战性的工作。应用程序的安全性取决于它最薄弱的环节,任何成功的应用程序安全策略的基础都是稳固的身份验证和授权手段,以及提供机密数据的
随着电子商务和电子政务的深入发展,数字签名技术变的越来越重要。与RSA密码体制相比,在密钥长度相同的情况下,椭圆曲线密码体制安全强度更高,因此基于椭圆曲线密码体制的数
一个好的网络入侵检测系统应该是鲁棒的、可扩展的和高效的。人工免疫系统所具有的分布式、自组织和轻量级特性正好满足了网络入侵检测系统的要求,因此人工免疫系统在网络入
由于森林火灾具有突发性和复杂性的特点,将计算机辅助技术应用于森林防火已成为必然的发展趋势。本文通过分析国内外对该课题的研究,提出了一种新的森林防火辅助指挥系统模型
随着计算机技术、网络技术和虚拟现实技术的不断发展,分布式虚拟环境(Distributed Virtual Environment,DVE)作为计算机科学的一个重要领域在理论和应用上都取得了重大的进步
近几年,统计中文分词已经成为学术界研究的主流并且在标注数据丰富的新闻领域取得了很好的性能。但是,在非新闻领域,特别是标注数据较少的领域,统计中文分词的性能仍旧差强人意。
基于我国医学图像远程诊断尚不发达的现状,本文设计并实现了一个可行的医学图像远程诊断系统以有效地解决医学图像远程诊断、医院现有信息系统整合和医学图像共享等问题。
Web服务是一种新型的Web应用程序,具有自包含、自描述、模块化和松耦合等特点,可以通过Web进行发布、查找和调用。简单地说,Web服务是“一次发布,到处可用”的新型Internet组
企业信息系统中普遍存在的“信息孤岛”严重地阻碍着企业信息化建设的整体进程,而传统的企业应用集成方案在实际应用中往往存在集成能力差、可扩展性差、互操作能力差、集成代
Ad HoG网络是由一组带有无线收发装置的移动终端组成的一个多跳的、临时的自治系统,是一种新型的无线通信网络。由于具有很大的灵活性,Ad Hoc网络能应用于传统的有线或无线网