基于邻域粗糙集的决策表和信息表属性约简研究

来源 :青岛大学 | 被引量 : 0次 | 上传用户:IT_Consultant
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
作为一种能够对不精确、不完备、不一致等不确定性的信息进行有效分析和处理的数据分析工具,粗糙集在知识发现、机器学习、模式识别、决策支持、预测建模和故障诊断等领域已得到了广泛的应用。经典的Pawlak粗糙集只适用于处理离散型数据,无法直接处理现实应用中常见的数值型数据。为此,基于Pawlak粗糙集,邻域粗糙集通过引入邻域粒化和粗糙逼近的概念,可以有效地处理这两种类型的数据。知识约简是粗糙集的主要应用之一。知识约简的目标是保持原有知识表达能力,并且删除掉知识表达系统中的冗余知识。基于粗糙集的知识约简研究主要是针对决策表和信息表的属性约简算法。此两类算法分别对应分类和聚类任务。本文基于邻域粗糙集,针对决策表和信息表的属性约简进行了如下研究:(1)基于邻域粗糙集的决策表属性约简研究:Ⅰ.对基于邻域粗糙集的决策表属性约简算法而言,正域计算是保证其有效性的重要依据,也是影响其时间开销的最主要部分。在现有的正域计算中,通常存在着大量同类别样本间的度量计算。为此,首先证明在邻域粗糙集的正域计算中,同类别样本间的度量计算对正域计算是无贡献的,而后据此提出了基于样本类别的正域计算及属性约简算法。实验结果表明,该算法有效且更快速,且更适用于样本类别数较少的数据集。Ⅱ.邻域粗糙集的正域计算沿用了Pawlak粗糙集中的包含关系,导致其容错性不佳。为此,首先引用最小风险决策规则对正域决策的风险进行评估,而后提出了一种基于容错改进的正域计算及属性约简算法。实验结果表明,该算法得到的属性约简集更好,且分类算法据此属性约简集对数据集进行分类的精度更高。(2)基于邻域粗糙集的信息表属性约简研究:为了设计一种信息表的属性约简算法,依据Pawlak粗糙集的信息表属性约简标准,而后提出一种基于邻域粗糙集的信息表属性约简标准及属性约简算法。实验结果表明,该算法所得属性约简集中的属性个数较多,聚类算法据此属性约简集对数据集进行聚类的精度较高。
其他文献
决策粗糙集和程度粗糙集作为两类广义的粗糙集模型,分别从相对信息量化和绝对信息量化的观点对经典的粗糙集模型进行了扩张。本文在序信息系统中将这两类广义粗糙集模型进行
目的:观察腹腔镜卵巢子宫内膜异位囊肿剔除术后联合促性腺激素释放激素激动剂(GnRHa)治疗的意义。方法:经腹腔镜手术确诊为卵巢子宫内膜异位囊肿的患者80例:对照组40例,术后
本文详细介绍一种基于STC89C52单片机的电子密码锁设计的设计方法以及思路。以STC89C52单片机作为微控制器,结合按键电路、LCD1602显示电路、报警电路、开锁驱动的电子密码锁
目的:探讨急性一氧化碳中毒后迟发性脑病的临床特点及治疗。方法:回顾性分析了60例急性一氧化碳中毒后迟发性脑病患者的临床资料。结果:急性一氧化碳中毒后迟发性脑病临床表
铁路运输的高速化逐渐成为铁路发展的新趋势,在拉动区域内经济发展以及促进我国国民经济总体发展方面扮演着越来越重要的角色,因此必须要保证铁路运输系统的安全可靠,这就需
语言是人类最重要的交际工具,并赋予了丰富的文化内涵。自从人类进入文明时代,礼貌语言就被人们广泛重视,一方面,他是社会文明和进步的标志;另一方面,他能帮助人们建立良好的
低碳经济理念是目前国际上和我国都遵循的一种绿色能源理论,建筑行业与国家的基础性设施建设息息相关。如何有效回收利用建筑行业中拆除的废旧建筑材料,可以实现生态环境的保
随着现代信息技术的大发展,图书馆的服务功能也在发生着巨大的改变,创客空间的引入使高校图书馆的功能和应用呈现出创新式的发展格局。而在我国创客空间的发展过程中也出现了
蔬菜生产作为增加农民收入的一个重要途径,其价格涨跌与民生紧密相关,因此,深入研究蔬菜价格波动及调控情况对人民生活及社会稳定具有重要意义。针对近年来蔬菜市场价格大起
主要从东海大桥混凝土结构特点和环境条件出发,研究并提出东海大桥混凝土结构耐久性策略和实施方案。基于上海地区已有原材料情况,配制和研究高性能海工混凝土的性能特点。并以