帕累托集成剪枝算法的研究与应用

来源 :南京邮电大学 | 被引量 : 0次 | 上传用户:liweitxwd147
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
集成学习是被广泛应用的学习技术之一,它通常需要训练多个基学习器。而已有的应用及理论研究表明,删除集成系统中一些冗余或者分类性能较差的基学习器,可以有效提升集成学习的泛化性能。帕累托集成剪枝(Pareto Ensemble Pruning)[1]算法是一种可以将泛化性能和集成规模(即基学习器个数)作为双目标共同优化的一种方法。为了进一步提升帕累托集成剪枝的分类性能,本文做了相关研究,且研究内容主要包含以下两个部分,第一部分,帕累托集成剪枝算法只考虑了基分类器的精准度与集成规模,忽视了分类器之间的差异性,从而导致了分类器之间的相似度比较大。因此提出了融入差异性的帕累托集成剪枝算法,该算法将分类器的差异性与精准度综合为第一个优化目标,将集成规模作为第二个优化目标,从而实现多目标优化。另一部分,在不平衡数据集的处理中,利用最小最大模块化划分数据集,将最小最大模块化网络(Min-Max Modular Neural Network,M3)方法中的数据划分部分与帕累托集成剪枝算法结合,提出了帕累托集成剪枝在模块化网络中的应用(the Application of Pareto Ensemble Pruning in Modular Network,APEPM)方法。与传统的处理不平衡数据方法不同的是,其数据的平衡处理是采用最小最大模块化划分,得到相对平衡的数据子块,而后根据帕累托集成剪枝的分类器子集搜索方法得到最优分类器的子集,最终得到具有较高泛化性能的集成分类结果。实验证明融入差异性的集成剪枝算法与原始帕累托集成剪枝算法在集成规模相当的前提下,改进的算法能够获得较好的性能,且该性能的提升是由于差异性的融入取得的;而针对不平衡数据集的帕累托集成剪枝在模块化网络中的应用方法能够取得比传统的集成剪枝方法更优的分类性能。
其他文献
由于图像匹配技术在现代信息处理领域中的应用范围越来越广泛,所以对图像匹配算法的研究不仅广泛,而且更加深入。如何在保持匹配准确性的同时,提高匹配速度是目前对匹配算法
信息过载严重影响了用户获取信息的效率。为了在网站上获取感兴趣的信息,用户需要花费大量的时间浏览与用户不感兴趣的信息。推荐系统可以帮助用户从海量的信息中高效地获取
随着信息化技术的发展,Linux已经被广泛地应用到服务器和桌面系统,近年来,随着嵌入式系统应用的持续升温,Linux也开始应用于嵌入式领域,逐步成为通信,工业控制,航天军工,医疗
随着科学技术的发展,网上购物成为时尚,网上购物方便、快捷、实用,成为我们生活之必须,针对我院目前毕业生大量学习及生活用品不方便携带,在校园内私设摊点又影响学院卫生,有
学位
机会移动社会网络是由具有社会特性的移动节点组成的特殊的机会网络。它不仅具有机会网络在通信方面节点之间连接中断、资源受限以及无法保证延时等特点,且节点的移动具有一定
传统的神经网络学习算法(如BP算法)在实数域和复数域中存在局部极小、收敛速度慢、难以求得全局最优点、权值是常数,难以反映样本的信息等缺陷;并且在实际应用中传统神经网络
当今企业发展的核心资源是人力资源,而薪酬管理是人力资源管理的一项重要内容。所谓薪酬管理是指组织管理者对员工的薪酬形式、薪酬结构、薪酬水平、薪酬等级、薪酬标准等内
近年来,虚拟机技术由于能够很好的屏蔽底层硬件资源的异构特性,具有提高资源使用效率,增强系统弹性和扩展性,减少硬件投资及管理维护成本等诸多优势而被广泛的应用于资源服务整合
节能环保是当今汽车领域中最重要的主题,燃料电池电动汽车、混合动力汽车、纯电动汽车和氢发动机汽车等都是应运时代主题而生的新能源汽车,其中混合动力汽车是目前最具有产业
在卫星网络体系中,不在同一个平面上的卫星会因为卫星间的相对运动不断的建立连接和断开连接,这使得卫星链路的连接很不稳定。星上资源相对有限,这使得卫星在进行高QoS的通信