论文部分内容阅读
粗糙集理论是由波兰数学家Pawlak于1982年提出,这一理论用于处理不确定性数据,利用等价类来划分整个给定的论域集合,通过上、下近似描述给定的任意集合。变精度粗糙集是粗糙集理论的扩充与延伸,这一理论针对集合描述问题,在经典粗糙集理论的基础上加入了错误分类度,使其在一定的可变范围内近似给定的集合。概念格理论(也称形式概念分析)是由德国数学家Wille在1982年提出,用于描述概念与概念之间层次关系的形式化工具。粗糙集理论与概念格理论作为数据分析和知识发现的强有力工具,越来越受到人工智能研究者的广泛关注。这两种理论已经被广泛应用于软件工程、数据挖掘、信息检索、机器学习、不确定性规则获取与决策管理等领域。在变精度粗糙集理论中,对于任意给定论域U中的子集A,若其不能够用某些等价类的并来表示时,则称这一子集A为粗糙集,否则称其为精确集。粗糙集可以用两个精确集近似,即上近似和下近似来描述。在概念格理论中,给定某一形式背景(O,P,I),这时可以将对象集的全体子集族分为外延集合与不是外延的集合(此处,外延就是该形式背景的某一概念的外延集)。利用寻找概念格的方法,可以将该形式背景所有概念找到,然而当对象集的任一个集合B不是某一概念外延时,可以用两个外延近似来描述。本文基于变精度粗糙集理论中的错误分类度,上、下近似算子,粗糙集中的包含度以及概念格中相似度的理论,分别提出了概念格中的上、下近似算子,近似距离的定义及计算近似距离的算法。主要研究成果如下:1.基于变精度粗糙集理论中的错误分类度以及上、下近似的定义,提出概念格中的上、下近似算子,讨论其性质,并得到上、下近似概念格,重点研究当给定不可定义的对象集X变化以及错误分类度?变化时,上、下近似之间的变化趋势,并通过实例说明了这一理论的正确性。2.基于粗糙集中的包含度以及概念格中相似度的定义,给出相似距离,即求出与对象集中任意不可定义的子集最接近的概念的外延,并给出如何求近似距离的算法过程。最后,通过实例说明这一算法的正确性及可行性,由此得到概念格中近似不可定义对象集的一种有效方法。