基于粗糙集理论的数据挖掘方法的研究

来源 :山东师范大学 | 被引量 : 0次 | 上传用户:supercow
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机技术的不断发展,人们在信息时代面临着越来越多的数据,如何发现隐藏在众多数据中的内部信息成为人们研究的热点问题。传统的数据库管理系统已经不能满足人们从数据库中抽取隐藏信息的需要,因此提出了知识发现和数据挖掘的概念。知识发现是从数据集中识别出有效的、新颖的、潜在有用的,以及最终可理解的模式的非平凡过程。数据挖掘是从数据库的大量数据中提取隐含的、未知的并有潜在价值的信息和知识的过程。数据挖掘是知识发现中最关键的步骤,也是知识发现技术难点,是目前相当活跃的研究领域。粗糙集理论是波兰数学家Pawlak Z于1982年提出的一种分析模糊和不确定知识的强有力的数学工具。粗糙集理论作为人工智能领域的一个新的研究热点,能有效地分析和处理不精确、不一致、不完整等各种不完备信息,并从中发现隐含的知识,揭示潜在的规律。这个特点使得粗糙集理论非常适合应用于数据挖掘。研究基于粗糙集理论的数据挖掘方法具有极大的理论价值和现实意义。本课题对基于粗糙集理论的数据挖掘方法进行了系统的研究,主要包括以下内容:1、介绍了数据挖掘和粗糙集的相关理论。分析了数据挖掘和粗糙集的研究现状,对其技术的热点、研究领域以及未来发展趋势进行了探讨,为本课题的全面开展奠定了基础。2、对粗糙集理论的约简算法进行了比较深入的研究。约简算法包括属性约简和属性值约简,其中属性约简是基于粗糙集理论的数据挖掘模型中的关键步骤,求取高效、快捷的属性约简算法是该理论研究的主要课题之一。论文介绍了基本的属性约简和属性值约简算法,并归纳总结了启发式属性约简算法。3、在目前属性约简算法的基础上提出了一种基于属性频率的改进的属性约简算法。该算法基于HORAFA算法,是一种启发式算法,在计算区分矩阵的基础上,最终能够找到决策信息系统的一个较优约简。4、针对传统的基于粗糙集理论的数据挖掘模型存在着不实用的特点,在其
其他文献
网络存储系统近来有大量的研究,其中大部分是集中在网络存储架构和性能方面。随着云存储成为信息领域的一个研究热点,已经有越来越多的研究开始考虑基于云存储的网络存储系统架
今天是一个信息爆炸的时代,各种信息指数级地快速增长,可用的数据资源种类也越来越多,这些数据分散在各个站点、文件系统、数据库系统和一些应用系统等中。由于各行业、部门
随着Internet的高速发展,产生了海量的Web信息,其中动态网页占了很大的部分。然而动态内容比静态内容需要更大的资源需求,并且给Web服务器带来了一个很大的问题,就是伸缩性。
XML正迅速成为Web上数据表示和数据交换的标准。作为自描述的标记语言,XML能够根据具体应用灵活地表现异构数据源中的各种信息,包括应用程序之间的数据交换、结构化和半结构化
近年来随着信息化程度的不断提高,人们对计算存储资源的需求呈现出高速增长的趋势。而本地文件系统由于其性能、容量、可扩展性等诸多方面的限制,已经无法满足人们日益增长的存
在移动互联网时代,用户越来越迫切需要随时随地的无缝接入无线网络。异构无线网络的融合为此提供了可能。为了尽可能为用户提供总是最优的服务,无线接入网络必须能够实现动态选
二十世纪六十年代以来,人们开始借助计算机来求解各类复杂优化问题。一类智能型的遗传算法(Genetic Algorithms,GA)在复杂优化问题的求解方面表现出了优越的性能,越来越多的受
电子邮件已经成为人们日常生活中通信、交流的重要手段之一。然而,大量出现的垃圾邮件,给用户造成时间和资源的浪费,同时极大地消耗了网络传输资源以及邮件服务器的存储空间,
伴随着Internet技术的快速发展,全球数据呈现爆炸式增长,全球数据的飞速增长给存储系统带来了巨大挑战,各种应对海量数据的存储系统不断出现。伴随着数据信息的爆炸式增长,如何从
XML技术越来越广泛的被应用于各个领域,使得以XML形式存储的信息量急剧增加,XML文档的安全性问题越来越重要,而访问控制技术是提供安全服务的关键技术之一。同一个XML文档中