论文部分内容阅读
波兰数学家Pawlak于1982年提出的粗糙集理论是一种数据分析工具,能比较有效地分析不完整、不相容、不精确等不完备信息,并发现其中的隐含知识,揭示潜在的规律。约简是数据挖掘的重要内容,也是粗糙集理论的核心问题之一。针对不同的信息系统研究者提出了多种属性约简理论与算法。针对实值信息系统,本文讨论基于相容关系的粗糙集模型和模糊粗糙集模型,研究实值信息系统的属性约简方法,并将成果应用于无线电信号识别领域。具体研究内容如下:1、借助于样本均值与方差,给出实值信息系统中两个对象关于属性的相似性度量,然后定义一定相似水平下论域上的一个相容关系,建立实值信息系统上的相容粗糙集模型,给出实值信息系统基于区分矩阵的属性约简方法。进一步,本文讨论了这种相容关系下协调实值决策表的属性约简与非协调实值决策表的分配约简,并给出约简的判定定理,得到计算约简的具体方法。2、从模糊粗糙集角度讨论实值信息系统与实值决策表的模糊相对约简。首先,基于实值信息系统中对象间的相似度在论域上定义一个模糊相容关系,给出实值信息系统基于模糊信息量的属性约简。其次,给出实值决策表中决策类基于模糊相容关系的模糊上、下近似,然后通过引入模糊近似质量,定义了实值决策表中条件属性的模糊重要度与相对重要度,并以此为基础,给出一种计算实值决策表模糊相对约简的启发式算法。3、以C波段无线电信号监测为应用背景,在无线电信号经过预处理的基础上,将无线电信号数据库抽象成实值信息系统的形式。采用基于属性模糊重要度的属性约简算法,得到了无线电特征数据库的特征约简。