论文部分内容阅读
粗糙集理论是一种处理不精确的,不确定和模糊知识的理论工具与方法,该理论在数据挖掘,人工智能,机器学习和模式识别等领域得到了广泛地关注和应用。由于数据源的多样性,客观事物的不确定性和技术限制,有时较难获取到精确的数据,从而导致不完备信息系统的产生,集值信息系统作为单值信息系统的拓展,可用来处理不完备信息系统。本文以集值决策信息系统为研究对象,研究了集值决策信息系统的属性约简问题。但由于在大数据时代下,许多数据往往是动态变化的,使用静态的约简算法较难适应动态数据下的属性约简,因此,对于粗糙集的动态数据更新方法的研究有着重要的现实意义。在此情况下,本文研究了集值决策信息系统中属性集增量式更新和对象增量式更新对属性约简的影响。本文主要研究了以下问题,并得到了一些创新性的结果:(1)针对集值决策信息系统的属性约简,建立了基于对象集的属性约简算法。将不完备决策表转化为集值决策信息系统,并详细分析了集值决策信息系统下基于相似关系的分布约简和最大分布约简,通过利用可区分对象集的集对,计算极小析取范式求解出所有的分布约简和最大分布约简。(2)针对集值决策信息系统中属性集的动态增加情况,通过引入条件信息量和属性重要性概念,设计了一种启发式的动态属性约简模型,当新的属性集增加到决策信息系统时,能够利用原系统的属性约简结果,快速更新属性集增加后的属性约简,并对更新后的属性约简中可能存在的冗余属性进行反向剔除,提高了计算效率。(3)针对集值决策信息系统中对象的动态增加情况,研究了新增对象对信息系统中原有知识的影响,分析了新增对象对分布约简的更新机制,提出了一种增量求解分布函数的计算方法,在此基础上,设计了集值决策信息系统的增量式属性约简模型,当新增对象加入到决策信息系统时,利用原决策信息系统的约简知识,快速更新分布协调集,并通过计算极小析取范式得到属性约简。