论文部分内容阅读
摘 要:粗糙集理论是一种新的分析和处理不精确、不一致、不完整信息与知识的数学工具,为智能信息处理提供了有效的处理技术,近年来,被广泛应用于专家系统、图像处理、模式识别、决策分析等领域。文中介绍了关于粗糙集的基本理论,并对其在各领域的应用情况进行了综述。
关键词:粗糙集理论;不确定性;知识约简
0 引言
粗糙集理论由波兰华沙理工大学Z.Pawlak教授于1982年首先提出,通过结合逻辑学和哲学中对不精确、模糊的定义,针对知识和知识系统提出了知识简约、知识依赖、知识表达系统等概念,并在此基础上形成了完整的理论体系——粗糙集理论。粗糙集理论把知识看作关于论域的划分,认为知识是有粒度的,而知识的不精确性是由知识的粒度过大引起的。从 1992年至今,每年都要以粗糙集为主题召开国际会议,近两年,召开的关于粗糙集的会议有2015年国际粗糙集联合会议和2016年第十六届中国粗糙集与软计算联合学术会议。粗糙集越來越受到各行业专家和科研人员的重视,随着对粗糙集理论研究的不断加深,越来越多的领域开始运用粗糙集解决问题。
(一).粗糙集理论
1.1 知识与知识系统
将研究对象构成的集合记为U,这是一个非空有限集,称为论域U,任何子集 ,称其为U中的一个概念或范畴。把U中任何概念族都称为关于U的抽象知识,简称知识。
R是U上的一个等价关系,由它产生的等价类可记为 ,这些等价类构成的集合 是关于U的一个划分。若 ,且P≠φ,则∩P也是一种等价关系,称为P上不可分辨关系,记为ind(P):
。
1.2 粗糙集与不精确范畴
给定知识库K=(U,Q),对于每个子集 和一个等价关系 R ind(Q),定义在知识系统U/R下集合X 的下近似为:
上近似表示属于X的对象组成的最小集合,即X的正域,记为
,而肯定不属于X的对象组成的集合称为X的负域,记为
。
在知识系统U/R下集合 X 的上近似为:
上近似是可能属于X的对象组成的最小集合。集合X的边界区域为:
边界区域是根据知识 R,U 中既不能肯定包含于集合 X,又不能肯定包含于集合X的元素构成的集合。
1.3 知识简约与知识依赖
知识简约,是在保持知识库分类能力不变的条件下,删除其中不相关或不重要的知识。令R为一簇等价关系, ,若ind(R)=ind(R-r),则称r为R中不必要的,若对于每一个 都为R中必要的,则称R为独立的,否则称R为依赖的。P中所有必要关系组成的集合称为核,记为core(P)。
定义知识R对知识Q的依赖程度为:
1.4 知识表达系统
在粗糙集理论中,一个知识表达系统可表示为S=(U,R,V,f),为其中U为论域,R为属性集合,V为属性值集合,f为一个信息函数,其对象的每个属性赋予一个信息值。即 。
决策表是一类特殊而重要的知识表达系统。设S=(U,R,V,f)为一个知识表达系统,R=C∪D,C∩D=φ,称C为条件属性集,称D为决策属性集。具有条件属性集和决策属性集的知识系统称为决策表。
(二). 粗糙集理论的应用
粗糙集理论具有很强的实用性,目前在各领域已有诸多应用。
2.1 故障诊断
文献[1]中提出了一种基于粗糙集与证据理论的航空装备故障诊断方法,利用粗糙集框架实现对故障诊断模型的构造并对冗余信息进行简约,通过边界粗糙熵来衡量每个条件对决策的重要程度;文献[2]利用变精度粗糙集和信息论中互信息增量的特性,针对倾转旋翼机在过度转换时的故障进行诊断,利用OMELM对变精度粗糙集属性简约进行故障分类。
2.2 图像处理
粗糙集理论对不精确问题能够提供较好的解决方法,文献[3]将粗糙集理论与模糊聚类算法相结合用以解决图像分割问题。文献[4]依靠粗糙集对边界区域近似有较好的解决能力,将粗糙集近似集与粒子群算法相结合来解决图像分割问题,利用粗糙集理论得到图像的最优粒度,再通过粒度划分得到图像的近似集,从而利用近似集得到便捷的精准刻画。
2.3 专家系统
粗糙集理论对规则的抽取有较好的应用,因此能够为专家系统的构造提供理论基础。文献[5]利用粗糙集理论获取知识,建立决策表,并利用可辨识矩阵对决策表进行条件属性简约,能够获得需要诊断的故障树。
2.4 模式识别
文献[6]中关于矿井突水问题,可利用粗糙集对非正态、非线性和高维数据的处理能力,对存在大量不明确对应关系的特征进行简约,剔除与决策无关的属性,得到简约样本。
2.5 决策分析
粗糙集理论在金融投资预测方面也起到了很大的作用,文献[7]基于优势粗糙集建立了证券投资分析模型,能够有效分析出股票的投资价值。文献[8]运用多粒度粗糙集为决策问题提供了新的思路,将多粒度粗糙集运用到专家的综合决策中并证明了研究的有效性。
(三).结语
在粗糙集理论发展的三十多年间,已取得了许多突破性研究成果,并成功运用到生活的各个方面。粗糙集能够处理不完整、不精确的大量数据,在实际应用中,将粗糙集与各种不同分类方法相结合,能够更快、更准确的提取出有用信息是未来研究的热点之一。
参考文献:
[1] 孙伟超,李文海,李文峰 . 融合粗糙集与D-S证据理论的航空装备故障诊断[J]. 北京航空航天大学学报,2015,41(10):1902-1909.
[2] 陈晓,王新民,黄誉,等. 倾转旋翼机飞控系统的变精度粗糙集OMELM故障诊断方法[J]. 控制与决策,2015,35(3):433-440.
[3] 马文萍,黄媛媛,李豪,等. 基于粗糙集与差分免疫模糊聚类算法的图像分割 [J]. 软件学报,2014,25(11):2675-2689.
[4] 姚龙洋,张清华,胡帅鹏,等. 基于近似集与粒子群的粗糙熵图像分割方法 [J]. 计算机科学与探索,2016,10(5):699-708.
[5] 李英顺,姜双双,佟维妍,等. 基于 RST 及 FTA 的综合传动装置故障诊断专家系统的应用研究[J]. 组合机床与自动化加工技术,2014(4):60-63.
[6] 王江荣,黄建华,罗资琴,等. 基于粗糙集的 Logistic 回归模型在矿井突水模式识别中的应用 [J]. 煤田地质与勘探,2015,43(6):70-74.
[7] 杨博翔.基于优势粗糙集的证券投资决策研究及应用[J]. 山东农业大学学报(自然科学版),2016,47(5):785-788.
[8] 郭庆,吴磊. 多粒度背景下直觉模糊信息系统的粗糙集及其决策[J]. 系统工程与电子技术,2016,38(2):347-351.
作者简介:
袁红杰(1994-),硕士研究生,研究方向为故障诊断。
关键词:粗糙集理论;不确定性;知识约简
0 引言
粗糙集理论由波兰华沙理工大学Z.Pawlak教授于1982年首先提出,通过结合逻辑学和哲学中对不精确、模糊的定义,针对知识和知识系统提出了知识简约、知识依赖、知识表达系统等概念,并在此基础上形成了完整的理论体系——粗糙集理论。粗糙集理论把知识看作关于论域的划分,认为知识是有粒度的,而知识的不精确性是由知识的粒度过大引起的。从 1992年至今,每年都要以粗糙集为主题召开国际会议,近两年,召开的关于粗糙集的会议有2015年国际粗糙集联合会议和2016年第十六届中国粗糙集与软计算联合学术会议。粗糙集越來越受到各行业专家和科研人员的重视,随着对粗糙集理论研究的不断加深,越来越多的领域开始运用粗糙集解决问题。
(一).粗糙集理论
1.1 知识与知识系统
将研究对象构成的集合记为U,这是一个非空有限集,称为论域U,任何子集 ,称其为U中的一个概念或范畴。把U中任何概念族都称为关于U的抽象知识,简称知识。
R是U上的一个等价关系,由它产生的等价类可记为 ,这些等价类构成的集合 是关于U的一个划分。若 ,且P≠φ,则∩P也是一种等价关系,称为P上不可分辨关系,记为ind(P):
。
1.2 粗糙集与不精确范畴
给定知识库K=(U,Q),对于每个子集 和一个等价关系 R ind(Q),定义在知识系统U/R下集合X 的下近似为:
上近似表示属于X的对象组成的最小集合,即X的正域,记为
,而肯定不属于X的对象组成的集合称为X的负域,记为
。
在知识系统U/R下集合 X 的上近似为:
上近似是可能属于X的对象组成的最小集合。集合X的边界区域为:
边界区域是根据知识 R,U 中既不能肯定包含于集合 X,又不能肯定包含于集合X的元素构成的集合。
1.3 知识简约与知识依赖
知识简约,是在保持知识库分类能力不变的条件下,删除其中不相关或不重要的知识。令R为一簇等价关系, ,若ind(R)=ind(R-r),则称r为R中不必要的,若对于每一个 都为R中必要的,则称R为独立的,否则称R为依赖的。P中所有必要关系组成的集合称为核,记为core(P)。
定义知识R对知识Q的依赖程度为:
1.4 知识表达系统
在粗糙集理论中,一个知识表达系统可表示为S=(U,R,V,f),为其中U为论域,R为属性集合,V为属性值集合,f为一个信息函数,其对象的每个属性赋予一个信息值。即 。
决策表是一类特殊而重要的知识表达系统。设S=(U,R,V,f)为一个知识表达系统,R=C∪D,C∩D=φ,称C为条件属性集,称D为决策属性集。具有条件属性集和决策属性集的知识系统称为决策表。
(二). 粗糙集理论的应用
粗糙集理论具有很强的实用性,目前在各领域已有诸多应用。
2.1 故障诊断
文献[1]中提出了一种基于粗糙集与证据理论的航空装备故障诊断方法,利用粗糙集框架实现对故障诊断模型的构造并对冗余信息进行简约,通过边界粗糙熵来衡量每个条件对决策的重要程度;文献[2]利用变精度粗糙集和信息论中互信息增量的特性,针对倾转旋翼机在过度转换时的故障进行诊断,利用OMELM对变精度粗糙集属性简约进行故障分类。
2.2 图像处理
粗糙集理论对不精确问题能够提供较好的解决方法,文献[3]将粗糙集理论与模糊聚类算法相结合用以解决图像分割问题。文献[4]依靠粗糙集对边界区域近似有较好的解决能力,将粗糙集近似集与粒子群算法相结合来解决图像分割问题,利用粗糙集理论得到图像的最优粒度,再通过粒度划分得到图像的近似集,从而利用近似集得到便捷的精准刻画。
2.3 专家系统
粗糙集理论对规则的抽取有较好的应用,因此能够为专家系统的构造提供理论基础。文献[5]利用粗糙集理论获取知识,建立决策表,并利用可辨识矩阵对决策表进行条件属性简约,能够获得需要诊断的故障树。
2.4 模式识别
文献[6]中关于矿井突水问题,可利用粗糙集对非正态、非线性和高维数据的处理能力,对存在大量不明确对应关系的特征进行简约,剔除与决策无关的属性,得到简约样本。
2.5 决策分析
粗糙集理论在金融投资预测方面也起到了很大的作用,文献[7]基于优势粗糙集建立了证券投资分析模型,能够有效分析出股票的投资价值。文献[8]运用多粒度粗糙集为决策问题提供了新的思路,将多粒度粗糙集运用到专家的综合决策中并证明了研究的有效性。
(三).结语
在粗糙集理论发展的三十多年间,已取得了许多突破性研究成果,并成功运用到生活的各个方面。粗糙集能够处理不完整、不精确的大量数据,在实际应用中,将粗糙集与各种不同分类方法相结合,能够更快、更准确的提取出有用信息是未来研究的热点之一。
参考文献:
[1] 孙伟超,李文海,李文峰 . 融合粗糙集与D-S证据理论的航空装备故障诊断[J]. 北京航空航天大学学报,2015,41(10):1902-1909.
[2] 陈晓,王新民,黄誉,等. 倾转旋翼机飞控系统的变精度粗糙集OMELM故障诊断方法[J]. 控制与决策,2015,35(3):433-440.
[3] 马文萍,黄媛媛,李豪,等. 基于粗糙集与差分免疫模糊聚类算法的图像分割 [J]. 软件学报,2014,25(11):2675-2689.
[4] 姚龙洋,张清华,胡帅鹏,等. 基于近似集与粒子群的粗糙熵图像分割方法 [J]. 计算机科学与探索,2016,10(5):699-708.
[5] 李英顺,姜双双,佟维妍,等. 基于 RST 及 FTA 的综合传动装置故障诊断专家系统的应用研究[J]. 组合机床与自动化加工技术,2014(4):60-63.
[6] 王江荣,黄建华,罗资琴,等. 基于粗糙集的 Logistic 回归模型在矿井突水模式识别中的应用 [J]. 煤田地质与勘探,2015,43(6):70-74.
[7] 杨博翔.基于优势粗糙集的证券投资决策研究及应用[J]. 山东农业大学学报(自然科学版),2016,47(5):785-788.
[8] 郭庆,吴磊. 多粒度背景下直觉模糊信息系统的粗糙集及其决策[J]. 系统工程与电子技术,2016,38(2):347-351.
作者简介:
袁红杰(1994-),硕士研究生,研究方向为故障诊断。