论文部分内容阅读
粗糙集理论是波兰学者Pawlak Z.在1982年提出的一种有效处理数据的工具,同一年德国数学家Wille R.提出了分析概念之间层次关系的概念格理论.作为分析数据和发现知识的两种工具,粗糙集与概念格被广泛应用于数据挖掘、机器学习、决策管理、信息检索、与软件工程等领域.属性约简是知识发现的一个核心问题.本文主要研究基于粗糙集和概念格的信息系统的属性约简,分别提出了L模糊概念格的属性约简、基于最大规则的概念格属性约简概念,分析了信息系统中代数约简和信息熵约简之间的内在关系.本文的主要工作如下:1.研究了L模糊概念格的属性约简.讨论一类常见的模糊形式背景—L模糊形式背景的属性约简,给出了L模糊形式背景下约简的定义以及约简的判定定理.借鉴经典形式背景下的属性约简的思想,结合模糊数学理论中截集的手法,构造出L模糊概念格属性约简的辨识矩阵,进而可利用布尔计算法得到属性约简集.同时,分析了这种约简形式下不同属性的特征.2.提出了基于最大规则的概念格属性约简.从决策形式背景中提取规则的目的是为了对新的对象进行判断,其中尤其重要的是最大规则,因为其他规则相对最大规则来说是冗余的.文中约简后的形式背景保持了最大规则所依据的事实(条件外延和决策外延)不变,而对最大规则的条件内涵和决策内涵进行了约简.前提条件的约简使得我们利用最大规则对一个新的对象进行判断时更加方便,而决策结果的约简则使我们的判断更加准确.同时,分析了基于最大规则的属性特征.3.研究了信息系统代数约简和信息熵约简之间等价和蕴涵的关系.利用一种新的信息熵定义了信息系统的熵约简,通过进行比较分析,分别在无决策信息系统、协调决策信息系统与不协调决策信息系统中得到这两种观点下属性约简的一些内在联系,揭示了不同意义下属性约简的本质联系.