论文部分内容阅读
粗糙集理论是一种工具,它被解释为一种数学工具,它能够处理不精确的信息和不完备的信息系统。粗糙集理论第一次被提出的时候是由荷兰科学家Palawk提出的。粗糙集理论展现“用数据说话”的理念在于其仅仅是利用数据处理信息,而不是需要先验知识。粗糙集理论的应用领域很广泛,例如:人工智能、认知科学等。权重确定是粗糙集理论的核心内容之一。权重确定不仅仅能够直接影响到决策结果,还能直接影响到最终的评判,因此其在评判和决策过程中非常重要。它体现了各个因素在这个决策评判过程中的地位与作用。目前有许多学者研究了粗糙集权重确定方法,这其中既有研究完备信息系统的基于粗糙集的权重确定方法,也有研究不完备信息系统的基于粗糙集的权重确定方法。本文在分析目前多种基于粗糙集权重确定方法的基础上,从事了以下的研究工作:本文研究了基于正区域的权重确定,基于条件信息熵的权重确定确定方法:依据正区域和条件信息熵的定义设计新的权重计算方法,新的权重确定方法把主观和客观经验结合在一起,但还是存在约简过高的情况,于是提出了修正的属性重要度定义以解决问题。为了解决约简过高的情况,设计了在完备信息系统下的基于粗糙集的条件信息熵的权重确定。该方法利用条件信息熵的定义把主观和客观经验结合在一起,还克服了约简过高,把非冗余属性约简为冗余属性的问题,因此具有更高的效率。基于粗糙集条件信息熵的权重确定方法,需要先求出条件属性的重要度,再利用属性重要度求出属性权重。然而基于粗糙集条件信息熵权重确定的方法求出的属性权重仍然不能保证不为O。为此,我们提出了一种改进的基于粗糙集的权重确定方法,该方法法利用了各个条件属性的重要度,以及利用决策表中确定的条件属性取值个数,提出了新的属性重要度和权重的定义。该方法克服了权重为0的情况,具有更高的效率。权重确定方法一直是决策与评价领域的热点研究,相对于决策表而言,条件属性的重要性是存在差异的。在一个决策表中,一些研究对象含有的未知值的属性的数目有时候相对整体而言是比较多了一点,但实际上这些属性的重要性是很低,换句话说,也就是不比较重要,这时候我们就可以认为这些对象是不可区分的。相对这个而言,也会有另外一些对象含有的未知值的数目相对于整体而言是少了一点,但其实这些属性的重要性是很高的,换句话说,也就是比较重要。这时候我们认为它们是可区分的。于是,我们在确定不完备信息系统的属性权重时,就不仅仅需要考虑属性的个数,还需要考虑属性的重要度。为了求出不完备信息系统的属性权重,我们先要求出不完备信息系统的属性重要度。在不完备信息系统中,属性重要度的定义与差异度有关系。所以在本文中,我们先引入差异度的定义,然后在此基础上,给出不完备信息系统的属性重要度的定义。然后在此新的属性重要度的定义基础上,给出不完备信息系统的权重确定方法。目前不完备信息系统的权重确定方法研究还很少,主要都是把完备信息系统的权重确定方法进行改进应用到不完备信息系统的权重确定里面去,为了进一步改善,使得求出的权重更加合理,本文中提出了一种新的不完备信息系统权重确定方法。该方法主要利用不完备信息系统条件熵的定义,结合属性集中条件属性的整体重要度和系统中条件属性的个体重要度,定义了新的不完备信息系统的属性重要度的定义,并给出了新的不完备信息系统的属性重要度的快速计算公式。新的不完备信息系统的属性权重的确定方法是在新的属性重要度的基础上提出来的。由于该方法利用了属性集中条件属性的整体重要度,并且结合了系统中条件属性个体重要度,使的求出的属性权重更加合理,故该方法的效率得到了改善。