关联规则数据挖掘方法的研究和应用

来源 :安徽大学 | 被引量 : 0次 | 上传用户:fskfxx
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术的发展,数据挖掘技术得到了广泛的关注。在数据挖掘技术中有很多研究领域,关联规则数据挖掘就是其中一个重要的研究方向,对它进行深入研究不仅有着重要的理论意义,而且有着重要的应用价值。关联规则数据挖掘于1993年由Agrawal等人提出,它最初是以分析事务数据库中项与项之间联系为目标,后来的研究者们对问题原型进行多方面的改进和扩充。目前,关联规则挖掘技术已经被应用到商业、电信、金融、农业、医疗等领域,并取得了良好的效果。 关联规则挖掘算法是关联规则数据挖掘研究中的主要内容之一,迄今为止己提出了多种关联规则挖掘算法,其中最著名的是Agrawal提出的Apriori算法。Apriori算法属于间接挖掘算法,它挖掘的是事务数据库中的全部关联规则,然而在实际应用中,企业关心的可能是与该公司某一产品或新推出的产品相关的关联规则,因此基于固定目标项目的挖掘具有一定的实用价值。本文在Apriori算法的基础上提出了一种适合目标项目挖掘的算法IBDF-Miner算法,同时针对Apriori算法的不足之处也作了一些改进,算法以改进的位图数据格式为存储结构,使得支持度的计算简单方便,而不再需要反复扫描数据库,并通过对位图矩阵的相应处理有效缩小了频繁项目集的生成空间,实验证明该算法有较好的执行效率。 根据规则涉及的维数关联规则可分为两种:单维关联规则和多维关联规则。由于关系数据库是数据挖掘最流行、最丰富的数据源,而关系数据库中隐含的关联规则通常具有多维性,因此本文对多维关联规则的挖掘算法进行了一些研究。传统的多维关联规则挖掘方法是将分类属性和量化属性进行离散化处理后采用成功的单维布尔关联规则挖掘算法进行挖掘,本文尝试直接对多维数据利用标准SQL语言来进行多维关联规则挖掘,算法的核心是利用sQL语言的查询和多表连接等语句对数据库进行操作,完成频繁谓词集和强规则的搜索过程。 在以上研究的基础上,本文将多维关联规则具体应用于道路交通事故数据挖掘中,从记录交通事故的数据库中发现有价值的规律。针对道路交通事故数据特点,本文提出了基于约束规则后件的关联规则挖掘算法,并将算法用于交通事故中“人、车、路”等因素对事故产生的影响的分析研究,得出了一些有实际意义的结论,这些结论与当地交警的经验基本上是一致的,根据这些结论可以采取针对性措施,用于辅助交通管理部门对今后的道路交通安全的改进工作,以预防和减少事故发生,保障人们的生命和财产的安全。
其他文献
随着电子政务建设的不断发展,电子政务建设和应用过程中的信息安全问题已经成为电子政务建设中的急待解决的一个突出问题。信息安全是建设电子政务的基础和关键。电子政务信息
随着医院信息建设的不断发展,各临床科室和医技检查科室对于业务流程优化、以患者为中心的信息共享及存贮的需求越来越强烈。而现有的各检查科室系统由于开发时间早,功能和性能
随着基于Internet商业应用的迅速发展,XML(eXtensible Markup Language,可扩展标记语言)已经成为Internet上数据表示和数据交换的标准格式,提出了对XML数据查询的要求。关系数据
互联网的发展,极大的推动了整个社会的发展,在社会、经济、教育和娱乐等各方面都产生了重大的影响。互联网与人们的生活越来越紧密,人们通过网络互相交流,共享一些资源,互联
随着市场竞争规则的变化,企业在提升产品质量的同时,越来越注意提高客户服务的质量,以提高企业的核心竞争力。中小型企业资金有限,要建立功能齐全的呼叫中心投资较大。近年来移动
为了提高WebGIS的响应速度,通常会采用瓦片地图技术。越来越多的地理信息系统(GIS)平台开始采用分布式数据库HBase来管理瓦片技术施过程中产生的大量以小文件形式存在的瓦片。瓦
随着经济的发展和人民生活水平的提高,需水量大幅度上升,而且对水质提出了更高的要求。饮用水水质规范中,浊度是一项重要的指标,直接关系到水质的好坏,而混凝投药过程中混凝剂的投
随着因特网的迅猛发展和广泛应用、无线移动通信技术的成熟发展和计算机处理能力的不断提高,基于移动计算的新业务和应用不断涌现,业已成为信息技术领域科学研究和产业发展的重
现代企业面临越来越激烈的市场竞争,为了取得竞争的优势,企业必须不断地调整和优化业务过程。传统的工作流管理系统已经不能很好的满足企业管理业务过程的需要,为此,近年来学
近年来,随着Internet/Web技术的快速普及和迅猛发展,其为人们提供了丰富的信息资源的同时,它所具有的海量数据、复杂性、极强的动态性和用户的多态性等特点也给Web资源的发掘