论文部分内容阅读
粒计算是人工智能领域新兴起的一个研究方向,是一种新的处理数据的方法和范式。该方法主要用于处理不确定的、模糊的、不精确的、部分真的和海量的信息,其基本思想是利用不同粒度上的信息进行问题求解。关于粒计算的问题,通常可以从两个方面进行研究:粒子的结构和粒子的计算,前者主要解决粒子的形成、表示和解释,后者主要解决粒子的使用问题。
在目前粒计算的研究中,各领域之间在粒的表示上并没有一个统一的框架,以至粒计算在智能系统的应用中形式化表示困难,计算复杂,所以粒的表示问题在很大程度上制约着粒计算的发展。针对这些问题,本文在基于粗糙集的粒计算理论中,尝试构建新的粒的表示方法,研究新的表示方法下粒的一些性质以及不确定性度量问题,进而对新表示方法下的粒结构层次进行深入的分析研究,并尝试将其应用于决策规则提取与知识检索上。本文的主要创新点如下:
(1)在传统粒计算理论的基础上并结合经典概念格理论中的形式概念分析,引入了概念粒的概念,并从概念粒的外延和内涵两个方面进行研究和计算。这种粒的表示方法不仅实现了传统表示方法所难以实现的度量计算,而且这种用粒来表示概念的方法对于经典概念格理论来说,将形式概念分析引入到信息系统中,打破了原来形式背景中的二值局限性,从而使粗糙集、概念格及粒计算紧密的结合在一起,能更准确地表述属性与对象之间的不确定关系。
(2)为了打破经典粒的表示方法适用性不强的局限,对经典粒表示方法下的原子公式加以改进,从根本上解决了粒在真值信息系统、不完备信息系统等系统中表示力弱、形式化繁琐的局限性。
(3)考虑实际中用户对数据分析兴趣的习惯,对新的粒表示方法下的粒结构进行分析并尝试应用,研究了基于信息系统的概念粒格计算及其性质,并把其应用到决策规则提取上;在真值信息系统上研究了粒的网络分层结构并尝试应用到知识检索上。这种对粒结构的分析的研究方法能够满足用户对数据局部分析或概化分析的兴趣点,同时提高了数据分析的效率。
(4)针对粒的不确定性度量问题,本文考虑用粒的距离来度量粒与粒之间的相异性,并以粒的距离为启发信息来度量粒的粗糙程度以及粒子中原子公式相对粒的重要度,从而诱发出对粒的约简研究以及在规则提取上应用的研究。