论文部分内容阅读
粗糙集理论作为一种重要的智能信息处理技术,在知识获取领域得到了广泛应用。经典粗糙集理论的核心概念是上近似集和下近似集,是应用精确集合包含来定义上近似集和下近似集的。然而,现实处理的数据大多是不精确的。因此,针对Pawlak代数粗糙集模型过于严格缺乏容错能力的问题,人们提出了一系列概率型粗糙集扩展模型,决策粗糙集模型就是其中一种。
随着市场经济的飞速发展,各种投资决策项目、风险评估分析需求日益增多,如何在风险代价最小化的基础上进行属性约简是我们面临的问题。另外一方面,在不同的系统中,人们对于属性约简的要求和期望也不同。比如,在一些工业实践中,如果能够获得多个属性约简,那么用户就可以根据属性特征获取的难易(代价)进行选择。因此,本文基于决策粗糙集模型,针对风险代价最小化的多个属性约简获取问题展开了研究工作。
最小属性约简问题是个组合优化问题。由于知识表中各个属性的重要程度并不一样,本文首先对属性重要度进行了度量,并以属性重要性作为启发式因子指导属性约简。在经典粗糙集模型下,属性个数的减少有可能降低属性集的确定性分类能力,因此在经典粗糙集模型下,属性约简必须保证属性子集的正域不变的这种要求是合理的。但是,在决策粗糙集模型下,将对象划分到正域随着属性个数的变化具有非单调性,减少部分属性则有可能提高属性的概率分类能力,所以经典粗糙集模型下的属性重要性的定义对于决策粗糙集模型下的风险最小化的属性约简有一定的局限性。因此,本文在基于风险最小化的属性约简中,除了考虑哪些属性对决策是重要的,哪些属性是冗余的,还考虑到了属性的删除与否是否产生代价的问题,从而提出了一种有效的风险最小化下的属性重要性的评估方法。
考虑到群体智能算法具有合作性,正反馈选择等特点,本文结合蚁群优化算法来获取风险最小化的多个属性约简。由于不同属性对决策表的决策分类能力不同,所以本文在基于决策粗糙集模型的属性重要性的概念基础上,基于蚁群算法框架提出了新的风险最小化的属性约简算法。通过将属性重要性这个因子加入到蚁群算法中的概率转移规则公式中,新方法使用了属性重要性之间的方差来描述属性重要性的差异性以解决某些数据集中条件属性集属性重要性差别不大的现象。对比实验表明本文提出的方法高效地解决了风险最小化的属性约简问题。