论文部分内容阅读
随着信息量迅速的增大,人们开始研究如何在没有专业知识的前提下作出更好的决策。近几十年来,为了确保使决策者在其研究的领域内做出科学的分析,许多重要的基础领域在慢慢的整合,如商业,工程,医药,法律,以及个人生活等。在做决策时,首先要考虑的就是因素不确定性。因此,我们需要研究如何将概率和选择性以一种合理的方式结合起来,使之可以用高级计算方式应对纷乱繁杂的决策问题,并且可以避免常见的思维错误。本文提出了一个新的范式来设计决策支持系统,该系统通过强化决策支持系统的不确定性来寻找决策过程的最佳选择。由于寻找最佳决策是通过分析数据来决策的,所以需要引入数据挖掘机制。根据研究表明,单个数据集不能取得效果,需要将几个数据集相结合来获取预期结果。但是,这些数据集差异通常比较大,因此在数据挖掘之前,需要对数据集进行处理。另外,在某种情况下,需要进行数据集的合并(例如,数据集存在异质性)。但是实现合并不是那么容易,受很多因素影响,比如数据匮乏(例如,时间,过程和空间)。一般来说,数据异质性问题是一个关系到决策过程的大问题。在以往的研究中,学者设计过很多不同的系统。因此,必须将不同的系统和数据转化成可以进行统一处理的系统和数据,但随着数据的剧增,这过程实现起来越来越难。将会导致资源管理和响应时间等问题,其中响应时间直接影响了决策过程。本文讲述的是粗糙集理论,粗糙集理论是一种用于处理不完全、含糊以及不确定数据的方法;本文包含了粗糙集理论的基本概念并且回答了以下问题:如何做数据分析而无需初步的和额外的数据信息;粗糙集分析方法有什么优点;粗糙集理论的应用是什么;粗糙集理论与数据挖掘的关系是什么。本文包含了一般的示例来阐述粗糙集理论的基本概念。本文也阐述了动态约简的概念。由于动态约简与粗糙集理论相互关联,用于必须理解本文讲述的粗糙集理论示例。并且,本章节阐述了寻找动态约简的方法、寻找动态核的方法以及动态约简的性质。本文讲述了解决以上问题的机制与算法。这些问题起源于在存放决策表的异构数据环境中的知识发现以及针对上文所提及机制的缺失值处理扩展。过滤异构决策表的机制和同步不同决策表的算法则用于寻找作为知识发现核心元素的约简与核。本文叙述了如何管理异构决策系统的数据集,并且着重阐述了如何计算两个或多个异构数据集的核和约简。