【摘 要】
:
作者的论文题目为"数量关联规则算法研究和数据挖掘原型系统设计",该文是对作者研究生期间所做研究工作的总结.随着关系数据库的迅速发展和成熟,特别是数据仓库技术的发展,相
论文部分内容阅读
作者的论文题目为"数量关联规则算法研究和数据挖掘原型系统设计",该文是对作者研究生期间所做研究工作的总结.随着关系数据库的迅速发展和成熟,特别是数据仓库技术的发展,相关的数据和信息是存在关系数据库或数据仓库中.关系数据库及数据仓库的数据类型非常丰富,数值属性是其中最为普遍的属性类型.而关联规则是存在于数据库关系表属性间的一项重要知识,因此研究适合关系数据库的数量关联规则挖掘算法,有非常普遍和实际的意义.鉴于目前该领域研究的现状、发展趋势和应用前景,我们选择了这一课题开展相关工作.该文的研究主要包括数量关联规则的挖掘步骤及QARM算法、数值属性离散化问题及算法、数量关联规则的聚类方法挖掘和数据挖掘原型系统框架设计等.我们通过对Boolean关联规则挖掘算法的研究,结合数值属性的特点,提出了数量关联规则挖掘的一般步骤,并提出了QARM算法.数值属性的处理是数量关联规则挖掘的关键问题,我们总结了几种常用的离散化算法,并深入研究了关联规则挖掘中数值属性离散化的几种策略.针对数量关联规则挖掘可能出现的问题,如规则的冗余,我们提出了数量关联规则的聚类方法挖掘.最后,我们还设计了一个数据挖掘原型系统UNMiner的框架,并实现了部分功能.UNMiner系统是一个试验平台,用它可以对数据挖掘算法进行测试,以检验数据挖掘算法的有效性.UNMiner系统也是数量关联规则算法研究的实验平台.
其他文献
数据质量是数据分析结论有效性和准确性的基础,也是最重要的前提和保障。造成数据质量问题的因素有很多,数据不一致性是其中的一个重要方面。在现实世界中,由于网络的普及,应用可
随着网络游戏的飞速发展,网络游戏拥有越来越多的用户,同时在线的规模也越来越大,以棋牌类游戏为代表的在线游戏在高峰时期有几十万人的在线规模。现今的多人在线游戏(Multiplay
随着Internet技术的高速发展,企业内部及企业之间的相互联系日趋加强,使得企业数据交换如同企业信息系统的动脉,高效而可靠的数据交换方式是企业提高商务效率、降低运作成本
网络缓存技术是一种把访问过的网络对象(网页、嵌入对象、流媒体等)暂存起来用于将来再次访问的网络技术。目前研究的重点已进入网络缓存协作的新阶段。网络缓存协作使更多的
本文针对入侵检测系统展开了相关的研究。首先分析了入侵检测领域的当前发展状况、存在的问题。当前入侵检测系统的误报率高的主要原因是:仅仅由单一的检测手段得到的不完善的
作者的论文的题目是"半结构化文本信息抽取系统",该项目得到了国家自然科学基金、北京市自然科学基金的资助.该文是对研究和实现信息抽取系统所做的工作总结.Internet的发展
低压电气设备综合试验装置是一套适用于煤矿车间使用的系统,可以完成三相异步电动机机械性能和电气性能的综合测试及井下低压防爆开关电气性能的试验。本文研究讨论了其相关软
工作流管理系统WfMS(Workflow Management System)是近年来随着Internet和Intranet的普及而快速发展的软件系统之一。工作流管理系统的主要目标是通过调用有关信息资源与人力资源来协调业务流程中的各个环节,使之按照一定的顺序依次进行,从而实现业务流程的自动化。 目前国内外虽然已经有了很多工作流管理系统的产品,但是大部分只能在设计阶段对工作流进行定义,并且工作
随着计算机网络、多媒体及信息科学的不断发展,数字媒体的产权保护已成为一个迫切需要解决的问题。但是传统的信息安全技术只能控制信息传播过程,对信息失真原因判断的模糊性,对
近年来,有关多agent系统与分布式人工智能的研究,已经成为人工智能领域的重要研究方向之一。多agent系统以人类社会为参考目标,重点研究集体的智能行为。 RoboCup(robot worl