测试代价敏感粗糙集中属性约简算法的研究

来源 :广西师范大学 | 被引量 : 1次 | 上传用户:hsjxln
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
粗糙集是一种刻画不完整和不确定性问题的数学工具,其不需要任何先验知识对数据进行分析和处理。面对如今高速的信息时代中海量数据的形成,粗糙集在分析处理数据中发挥了重要的作用。属性约简作为粗糙集理论研究的重要内容之一,其核心思想就是保证知识库的分类能力不变的前提下,删除冗余、错误或者不需要的知识。而代价敏感学习是目前机器学习、数据挖掘等领域研究热点之一,代价包括测试代价、误分类代价、计算代价和获取样本的代价等,其目的是以最小代价为目标建立分类器。将代价敏感学习引入粗糙集理论中的属性约简问题值得深入研究,目前将误分类代价引入粗糙集理论中的相关研究取得了不错的研究的成果,而测试代价敏感粗糙集理论的相关研究近几年才开始发展。本文主要研究测试代价敏感粗糙集中属性约简问题,分别以完备决策表和不完备决策表作为研究对象,主要的研究工作有以下几个方面。(1)为了解决测试代价敏感属性约简的高效性和准确性问题,提出一种基于免疫量子粒子群优化的最小测试代价属性约简算法。依据条件信息熵和测试代价因素定义适当的适应值函数,将最小测试代价属性约简问题转化为0-1组合优化问题,提出最小属性的属性约简问题是一种具有特殊测试代价的最小测试代价属性约简问题。最后结合量子粒子群和人工免疫方法给出约简算法,实验分别对比已有的最小属性约简算法和测试代价敏感属性约简算法,实验结果表明该算法是有效可行的。(2)在不完备决策表中,给出高效的计算容差类算法。提出不一致对象概念,研究不一致对象的性质,根据其性质给出在不一致对象下的核属性和属性约简的定义并设计求核属性算法。提出一个新的属性重要性定义,最后依据新的属性重要性定义设计一个最坏情况下时间复杂度和空间复杂度分别为O(k|C|2|U|)和O(|U|)的启发式属性约简算法,其中k为条件属性中缺省对象所产生的容差类最大的个数。算法过程只需逐步要求容差类的基数,大大减少了算法的计算过程。最后通过理论分析、实例分析和实验分析说明该算法是高效和可行性的属性约简算法,并且该算法同时适用于不一致不完备决策表和一致不完备决策表,给不完备决策表属性约简算法提供了新的方法。(3)提出不完备决策表测试代价敏感属性约简问题,给出不一致对象集定义以及求解不一致对象集的算法。根据不一致对象的性质改进属性重要性定义,考虑测试代价因素以及不一致对象个数的改变量给出一个新的属性重要性的定义和属性重要性中权重的设置方法,并给出属性重要性的计算算法。在此基础上,给出一个时间复杂度O(k|C|2|U|)和空间复杂度为O(|U|)启发式属性约简算法,其中k为条件属性中缺省对象所产生的容差类最大的个数,并通过理论分析、实例分析和实验分析说明该算法准确性和可行性。
其他文献
内容管理系统是当前计算机领域的一个重要应用,是对各种数字资源进行全面管理的有效途径,并将成为管理信息系统架构的核心,所以完整的管理信息系统的底层整合机制,不仅包括应
三维激光线扫描仪能够快速测量产品原型和各种模具,方便快捷地建立三维物体的CAD模型,在数字化设计与制造,如汽车制造、运动器材、家具、文物古董和工艺品的复制、三维动画、
随着计算机科学技术和物联网不断的发展壮大,越来越多的数据以短文本的形式出现在互联网上例如新闻标题、贴吧言论、微博消息等。对短文本数据运用分类、聚类的技术,从中挖掘
基因表达数据分析是生物信息学领域中的一个非常重要的研究方向。基因表达数据不仅包含了非常多基因活跃性的信息,还反映了细胞目前生理状态。寻找基因表达之间的关联关系可
电力系统数据压缩是目前新兴的研究课题,它随着电网规模的扩大、电力信息化的发展、基于广域信息的应用而变得越来越重要。小波变换具有良好的局部特性和空间—频率特性,因而被广泛应用于电力系统数据压缩领域。但是传统小波不能同时具有对称性、正交性、短支撑性、高阶消失矩等性质,在一定程度上影响了压缩效果。多小波的出现为解决这一问题提供了一条新方案,但目前研究的多小波压缩算法只是基于阈值压缩的,压缩方法有待改进。
近些年,随着私家车数量的增加,交通拥堵问题变得越来越严重。交通部门在解决交通拥堵问题的过程中,需要对解决措施进行评价。微观交通仿真系统通过建模和推演,能够再现交通流
随着信息化的不断深入,IT技术已经渗入到企业生产运作的各个环节。工作流管理技术正是从通过提高企业整体协作效率来提高企业生产效率的角度出发,提供对业务过程中的各个活动
对于虚拟平台模拟技术来说,各种特效一直是研究和开发的热点,已经涌现了大量的研究成果,也出现了很多比较成熟的算法应用,但是单一的一种特效不足以表现整个真实世界,缺少一
近些年来,网格计算已经成为是网络计算、分布式计算以及高性能计算领域中研究的重点和热点,随着网格技术的发展和网格基础设施的不断改善,网格社区中对网格应用的需求也不断
无线通信技术的飞速发展和移动终端设备的不断更新为行业用户的工作、生活提供了无限的扩展空间。SMS是短信息服务(Short Message Service)的简称,是一种非常普及的移动数据