关系数据库中关联规则挖掘算法的研究与实现

被引量 : 11次 | 上传用户:gianfranco1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据库技术的逐渐成熟、网络技术的迅速普及和计算机硬件的不断出新,使人们采集数据的能力得到了极大的提高,从而导致了全球范围内数据存储量的急剧增大。为增强人们对这些海量数据的理解能力,数据挖掘技术近年来得到了快速发展。 关联规则挖掘是数据挖掘的重要内容之一,1993年由Agrawal等人提出,它最初是以分析事务数据库中项与项之间联系为目标,后来的研究者们对问题原型进行多方面的改进和扩充。目前,关联规则挖掘技术已经被应用到商业、电讯、金融、农业、医疗等领域,取得了良好的效果。 关系数据库是众多行业和部门用于存储其生产、管理和科研等大量信息的重要形式,数据量的增长极为迅速。积极研究在关系数据库中挖掘关联规则的有效技术具有极为广阔的发展前景。 关系数据库中隐含的关联规则通常具有多维性、多值性和多概念层性,比事务数据库中的布尔型关联规则更加复杂。本文在对Apriori、SETM等事务数据库中布尔型关联规则的典型算法进行分析后,提出了一种关系数据库中关联规则挖掘算法。该算法的核心是利用SQL语言的聚集查询和连接等语句对关系数据库进行操作,完成频繁谓词集和强规则的搜索过程。由于SQL语言对关系数据库操作的高效性和算法与数据库管理系统的紧密性,所以算法具有较高的挖掘效率。 基于约束的关联规则挖掘一方面可以加强用户对挖掘过程的主导作用,使挖掘目的更加明确,另一方面可以大大减少算法的搜索次数,提高挖掘效率。本文在无约束的关联规则挖掘算法的基础上,经过改进和简化,提出了元规则约束下的挖掘算法,为用户快速探查和考证等方面的工作提供了有力支持。 在以上研究的基础上,本文介绍了一个简单的挖掘工具原型的设计与实现方法,其中考虑到关系数据库中属性的取值在现实中往往具有概念分层,所以在挖掘工具中提供了属性概念分层的静态解决方案,使用户可以在属性的不同概念分层中进行关联规则挖掘。
其他文献
在饱食投喂条件下,选用鲜活饵料沙蚕(Nereis succinea)对凡纳滨对虾(Litopenaeus vannamei)亲虾进行营养强化培育60 d,通过比较不同的投喂频率2次/d(F2组)、3次/d(F3组)、4次/d(F4组)对
<正>定价:199.00元ISBN:978-7-117-25718-2在我国引入和推广《眼科临床指南》可以使我国眼科医师有机会接触和了解到国际眼科临床的先进水平,根据我国实际情况实施《眼科临床
南朝刘宋、萧齐两代是中国历史上皇族内讧严重而且集中的时期,这一时期的皇族斗争呈现出毁灭性、残酷性的特点。本文从政治制度、寒族崛起、皇帝和宗室的个人原因以及社会心理
根据对中国民办高等教育发展历史的考察,本文所讲的新时期,从时间跨度上,主要是指20世纪80年代以来的20余年时间,它是我国民办高等教育迅速发展的时期。1982年,第一所民办大学——
继当代艺术家绘画材料与技法丛书《当代艺术家油画材料与技法》出版之后 ,中国青年出版社又推出《丙烯画材料与技法》和《色粉画材料与技法》 ,加上《水彩画材料与技法》形成
本论文主要是从华文文学的产生视角出发,根据其产生、发展和现状的历史意义、社会意义与审美意义,通过多方面的考察与研究,系统阐述印尼华文文学的发展过程。百年来的印尼华文文
房地产业是我国国民经济的支柱产业,房地产税收越来越成为我国财政收入的重要组成部分。然而同房地产业蒸蒸日上的发展势头相比,我国的房地产税制已不能适应我国房地产市场经济
研制高效率低污染的发动机是进入21世纪以来世界各国所极力追求的目标。HCCI这一新型燃烧方式是实现该目标的重要技术手段,为此而得到广泛和深入的研究。 本文结合内燃机燃
目的于汉逊酵母中表达肠道病毒71型(enterovirus 71,EV71)类病毒颗粒(virus-like particle,VLP),并分析其免疫原性。方法将鉴定正确的重组质粒p MV-P1-3CD转化汉逊酵母AU0501
<正> 1、1984年,国家科委(注:1998年国务院机构改革后更名为科技部)科技促进发展研究中心,组织了"新的技术革命与我国的对策"的研究,提出了建立创业投资机制促进高新技术发展