动态数据库中频繁模式的增减量维护

来源 :广西师范大学 | 被引量 : 0次 | 上传用户:QHP925
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在过去的二十多年里,随着数据库技术的迅速发展以及数据库管理系统的广泛应用,人们收集数据的能力有了巨大的提高,积累的数据越来越多。海量的数据背后隐藏着许多重要的、有趣的信息,人们希望能够对其进行更高层次的分析,以便发现有用的知识,从而更好地利用这些数据,为管理者提供强有力的决策支持。传统的数据统计分析方法已经不能够满足目前的需要,于是数据挖掘技术便应运而生了。数据挖掘(Data Mining),也称为数据库中的知识发现,是指从大量的、不完全的、有噪声的、模糊的数据中抽取出潜在的、有效的、新颖的、有用的和最终可以理解和运用的知识的过程。它是涉及数据库、计算理论、人工智能、统计理论、认知科学等众多学科的一门交叉学科,能够对数据进行关联分析、分类、聚类、预测、孤立点分析、演变分析。尽管数据挖掘技术诞生不久,但它广泛的应用前景和巨大的魅力,吸引了众多学者极大的研究热情和产业界人士的广泛关注。关联分析是数据挖掘中最重要的研究领域之一。Agrawal等于1993年首先提出了挖掘顾客交易数据库中项集间的关联规则问题[12]。以后众多的研究人员对关联规则的挖掘问题进行了大量的研究[13,14,15,17,19],他们的工作包括对原有的算法进行优化,如引入随机采样、并行的思想等,以提高算法挖掘规则的效率,对关联规则的应用进行推广。一般而言,从数据库中发现频繁模式是关联分析的核心任务,因为从频繁模式生成关联规则只是一个简单的计算问题。运动是自然界永恒的真理。我们所获得的数据也是在动态地改变着。相应的,我们运用数据挖掘技术从数据中获得的知识也要随着数据的改变而改变,以反映出新的趋势。增量算法能够通过处理新增加的数据来满足对原有知识的更新、加强的需要,这种方法避免了对整个数据集重新进行挖掘。1989年,Paul Utgoff等人提出了决策树的增量更新算法ID5R[8,9],使得著名的决策树算法ID3[43]能够根据动态增加的实例对整个树的结构进行调整。关联规则的增量挖掘算法FUP和FUP2[5,21]是由David W. Cheung等人于1996,1997年提出的。它们采用类似于Apriori[12]算法的“产生-验证”候选集的方法,对新增加的数据集进
其他文献
<正>巴西家禽联盟(UBABEF)的数据显示,2011年前10个月,巴西鸡肉出口总额达到67.43亿美元,同比增长21.1%。1~10月,巴西鸡肉装船重量达323.3万公吨,同比增长1.5个百分点,2009年
目的探讨短暂性脑缺血发作(transient ischemic attack,TIA)的概念、病因、脑动脉影像学的特点、预后相关因素及青年类型特点。资料和方法1.临床资料:我院1990年-2008年间TIA
基于模型的“Min-Max”鲁棒控制(RMPC:Robust Model Predictive Control)虽然有时较保守,但它设计较简单,理论分析较方便,是目前处理参数时变多面体不确定线性系统的一种流行且有
目前中国的养殖业发展还是以农民养殖为主。农民养殖涉及到千家万户,这种传统的养殖方式由于规模小,养殖技术水平不高,饲养管理不善,防疫意识不强等原因,极易造成动物患疫病
"一方水土养一方人".用这句中国谚语,去了解和认识另一个国度、另一个民族,也是恰如其分的.这是我在俄罗斯工作生活期间的切身感受.……
期刊
随着我国养殖业的发展,养殖结构正在从分散型向规模养殖型过渡。在这一过程中,与养殖业息息相关的兽药行业也在经历着变革和发展。从源头兽药生产企业到终端的零售商,无不在随
我和我的兄弟都喜欢做菜,对家常菜而言,手艺大致也还说得过去.当然,我多读几年书,嘴上功夫比兄弟要强些,实际做起菜来,却不如他.……
期刊
离岸金融市场是金融自由化、国际化的产物,自20世纪50年代产生至今,迅速发展成为现代国际金融体系的重要组成部分,为许多国家带来了巨大的收益,甚至带动该国经济的发展与飞跃
随着生活水平的不断提高,作为畜产品较单一的产区,广大牧区群众对畜产品种类的需求越来越广,对动物及其产品质量的要求也越来越高,而运输工具也就成为牧区动物疫病传播主要途
从前,有一个姓周的小医生,撮录了一个疯子--"某君昆仲"--之日记,取名<狂人日记>发表出来,供医家研究.不料文章引起巨大轰动,周大夫也因此出名,"从此以后,便一发而不可收,写出
期刊