论文部分内容阅读
复合粗糙集模型是一种用于处理复合信息系统中不精确、不确定、不完备、不一致信息的数据分析工具。复合粗糙集模型适用于同时包含多种数据类型的复合信息系统,有很好的应用前景。因此,在目前,复合粗糙集成为了数据挖掘领域众多学者关注的一大热点问题。然而,复合粗糙集模型存在一些缺陷,一方面,复合粗糙集模型缺乏对噪声数据的适应能力,另一方面,复合粗糙集模型只能对论域进行划分。本文针对复合粗糙集模型的这些不足之处,分别将复合粗糙集模型与变精度粗糙集模型、覆盖粗糙集模型结合在一起,提出了复合粗糙集模型的三种扩展模型,即变精度复合粗糙集模型、复合覆盖粗糙集模型、多变精度复合粗糙集模型,并对每一个扩展模型进行了系统的研究。具体研究内容如下: (1)由于复合信息系统中存在噪声数据,同时,复合粗糙集模型对近似边界要求严格等问题,所以,本文通过引入阈值参数,构造出了变精度复合粗糙集模型,同时,该模型的相关概念及性质相继给出并得到证明,最后,该模型在复合信息处理中的应用通过实例得到验证,从而指出了该模型具有一定的容错性,使得抗干扰能力得到增强,应用范围也进一步扩大。 (2)由于变精度复合粗糙集模型所有属性采用同一个阈值参数,导致该模型缺乏灵活性,为此,通过对复合信息系统的各个不同属性集分别引入不同的阈值参数βi(0≤βi<1),(i=1,2,...),可对每类属性集进行相应的变精度粗糙集操作,然后,通过对各个属性集执行相应的变精度粗糙集操作,同时,将操作结果组合起来取交集,于是,多变精度复合粗糙集模型被提出,同时,与之相关的概念及性质也相继被提出。在此基础上,将多变精度复合粗糙集模型运用于复合信息系统,进一步用实验数据证明了该模型的灵活性得到增强。 (3)针对覆盖粗糙集模型仅适用于单一数据类型的论域覆盖及复合粗糙集模型仅能构成论域上的划分等问题,首先通过建立多种覆盖关系(邻域覆盖、集值覆盖、区间值覆盖等)提出复合覆盖粗糙集模型,同时给出该模型的相关概念及性质;然后,复合覆盖粗糙集模型在复合信息系统中的应用通过实例得以说明,实例也进一步验证了该模型更符合实际情况,更具有实用性。