粗糙集的不确定度量理论及启发式属性约简算法研究

来源 :河南师范大学 | 被引量 : 0次 | 上传用户:meganleejin
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
粗糙集理论是近年来发展起来的一种处理不确定、不精确、不完整数据的新的数学工具[1]。粗糙集理论自波兰科学家Pawlak于1982年提出以来,已经被成功的应用于机器学习、数据挖掘、决策支持与分析、软计算等领域[2-8]。粗糙集理论中根据等价关系对论域进行划分,不同的等价关系对论域进行划分会得到不同的划分模块,划分越粗,得到的划分模块越大,信息含量越少,不确定性越大;划分越细,得到的划分模块越小,分类越精确,信息含量越大,不确定性越小。如何度量不同等价关系对论域划分的粗细及分类的精确程度,如何度量划分的不确定性,即不确定度量理论的研究是粗糙集理论研究的一个重要方面。高效的属性约简算法是粗糙集应用于知识发现的基础,寻求快速的属性约简算法是粗糙集理论的研究热点之一。如何基于粗糙集的不确定度量理论,运用启发信息来简化计算以找出属性集的最小约简是粗糙集理论研究的一个重要方向。这就需要提出合适的度量理论,并基于该度量理论设计有效的启发式属性约简算法,因此需要对粗糙集理论中的不确定度量理论进行研究。本文对粗糙集理论中的度量理论进行了研究,给出了一个统一的度量集合间贴近度的方法,根据该方法,提出了度量信息系统、决策系统、不完备信息系统、不完备决策系统中划分之间贴近度的方法,并对这些系统中的划分贴近度分别进行了系统研究,给出各系统中划分贴近度的一些性质及相应的理论证明,根据划分贴近度设计了对以上各系统进行属性约简的启发式算法。针对信息系统,由于知识中属性的逐渐增加或减少的变化,导致知识对论域产生不同粗细的划分,并得到不同大小的信息粒,给出了两个新的度量方法---粒度熵和粗糙熵,用于度量知识随着属性的增加或减少对论域产生不同划分时的分辨能力,并基于粒度熵设计了对信息系统进行属性约简的启发式算法。决策表是一类特殊而重要的知识表达系统,多数决策问题都可以用决策表形式来表达[9]。本文根据决策系统的特点,对决策系统中决策属性集相对条件属性集的正域和依赖度进行了研究,给出了一个新的计算决策系统中正域和依赖度的方法,提出了一个基于依赖度的决策系统启发式属性约简算法。
其他文献
协同过滤(Collaborative Filtering)作为一项信息发现技术,近年来被广泛应用在推荐系统的实现中。协同过滤利用所有用户(User)跟所有物品(Item,被推荐的内容)的历史交互信息,
随着计算机视觉研究领域的不断拓展,许多新的图形图像形式逐渐成了计算机视觉研究的对象,同时对处理结果的要求也越来越苛刻。在这背景下,一些新的视觉特征结构提取算法逐渐
计算机软硬件技术飞速发展,有力地推动了嵌入式系统等专用计算机系统的广泛应用。一方面,在很多嵌入式系统中,系统使用者往往要求具有菜单、窗口和按钮等图形元素的人机交互
在经济全球化背景下,虚拟企业成为未来制造企业的主要运作模式。在信息技术领域,网格技术致力于提供支持虚拟企业的信息基础设施。利用网格及其相关技术构建制造网格是制造企业进行网络化制造的发展趋势。资源管理和调度是制造网格的核心技术之一。本文在分析网格资源管理与调度需求的基础上,提出制造网格资源管理和调度的多Agent模型。模型中主要包括用于代表制造网格资源的Resource Agent,用于代表用户的B
近几年随着无线通信技术、传感器技术、信息采集和处理技术的飞速发展,出现了低成本、低功耗、多功能的微型无线传感器节点。无线传感器网络是随着传感器节点的发展而兴起的
多年来,很多有理想互相关特性的周期为2 n ?1(n为非负整数)的二元序列族被提出,包括:Gold序列族;针对奇数n与Gold序列族具有相同互相关函数分布的类Gold序列;针对偶数n Udaya
近年来,由一组相互独立的系统组合而成的复杂系统,亦即“系统的系统”(System of Systems, SoS)逐渐引起了研究人员的重视。由于SoS的地理上的分散性、系统之间的复杂的交互
计算机网络在提供开放和共享资源的同时,也不可避免的存在着安全风险。了解网络系统现有以及潜在的风险所在,评估这些风险可能带来的安全威胁与影响程度,是实施安全建设必须
多标记分类研究一个对象同时与多个标记相关的问题。与传统的单标记分类相比,多标记分类更普遍,在许多领域,例如多主题文本分类、图像与视频标注等方面都具有实际的应用意义
随着计算机技术突飞猛进的发展,越来越多的企业对企业信息系统要求越来越高。软件开发者不断地研究比较优越的系统。框架成为一个系统的坚实砥柱,所以选择优秀的框架是研发者一