ARMRDB模型中的聚类分析和规则提取

来源 :江西师范大学 | 被引量 : 0次 | 上传用户:herozerg
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文以江西省自然科学基金项目“数据挖掘的系统模型研究与实现”为课题主体,在深入研究模糊集理论和粗糙集理论和广泛了解国内外数据挖掘发展现状的基础上,提出了ARMRDB(Association Rules Mining in Relational DataBase)模型,该模型是基于关系数据库的通用关联规则挖掘模型。 本文介绍了ARMRDB模型的实现原理、基本结构和主要技术,详细阐述了模型中聚类分析和规则提取这两个关键环节的实现技术和工作流程。在模型的算法设计中充分考虑了算法实现的时空复杂性,使用增长型算法提高了模型的鲁棒性。在聚类分析中,利用模糊集方法对原始数据进行初始化处理,采用模糊相似算法实现了初始化数据的聚类,并提出了奇异类的概念。经过聚类后的数据对象,在同等类中具有相似的属性特征和数值规律,可以消除非同等类数据噪声的干扰。在规则提取中,利用粗糙集对不确定数据对象的分类优势,对各分类集进行属性约简,消除了数据对象中的冗余属性,从关键属性集中提取相应的关联规则,对输出规则的前、后件形式可以根据领域知识作出相应的调整。在规则提取的前阶段,将奇异规则另作分析,提高了规则提取的效率。为了获取真正有兴趣的规则,在考察规则客观兴趣度的同时,用相关分析的方法对强关联规则进行约束,以提高规则的精确度。对于模糊综合评价算法和主观兴趣度量的进一步研究与探索,是对ARMRDB模型的发展和完善,也是我们下一步的工作重点。 全文共分为七部分,分别讨论了课题来源及研究目的、模糊集和粗糙集理论知识、ARMRDB模型的基本原理、聚类分析及其实现、属性约简和规则提取技术。
其他文献
本论文结合实际课题,以电信Internet认证/计费系统的开发和实现为研究背景,在详细分析LDAP基本协议模型、基本目录服务模型和体系结构的基础上,对LDAP在电信企业级环境中的应用和
当前随着计算要求的不断提高,并行计算发展方兴未艾,分布式并行计算更成为新的潮流。消息传递方式是广泛应用于一些并行机,特别是分布存储并行机的一种模式。在基于消息传递的分
在校园网的日益普及的今天,代理服务器已成为校园网连接Internet的常用的解决方案。由于代理服务器本身不具备计费管理的功能,因此,校园网的计费管理问题须亟待解决。本文设计一
该文首先综述了一系列有关XSLT技术的背景知识,主要是XML及其相关技术,包括XML命名空间、流行的XML应用编程接口、XPath语言、CSS与XSL样式表语言,并扼要阐述了XML应用体系.
随着分布对象技术的发展,在对象层提供服务器群的负载均衡方案是当前研究的重要方向.为了实现对采用JavaRMI分布对象技术构造的远程对象服务器进行集群扩展,作者分析了RMI分
并行分布计算已经成为一种解决许多大型科学和工程问题的十分有效的方式。影响并行分布计算性能的因素有很多,诸如任务粒度、处理机的分配和网络拓扑等,其中任务调度策略是影响
本文基于现代教学的需要,研究了计算机技术、网络技术及其多媒体技术在CAI中的应用,设计了学生认知模型,制作了基于网络的多媒体课件系统,较好地解决了CAI课件对个别化自主学习与
该文针对当前Web入侵的实际背景,在分析当前国内外入侵检测系统及采用技术的基础上提出一种基于贝叶斯决策的智能入侵检测方法,并在此基础上开发了一个原型系统:S-WEB系统.该
近二十年来,计算机网络得到了极大的发展,目前已进入到一个新的发展时期,即ATM交换网和宽带业务综合数字网的时期。网络新时期的特征是在计算机网络业已发展的基础上,将综合业务(
近年来,智能控制技术在对不确定非线性动态系统的控制领域的应用和研究越来越受到关注,并且取得了很多成果。本论文主要分为两大部分。第一部分主要运用多层神经网络所具有独特