基于多样性度量的选择性集成改进算法研究

来源 :南京邮电大学 | 被引量 : 0次 | 上传用户:chunyu1988
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
选择性集成的基本思想是将分类器集合中性能相对不好以及由于分类性能相似造成冗余的分类器剔除,保留部分分类器参与最终的集成。学者们将选择性集成方法大致分为选择、排序、优化以及聚类等四类方法。本文在深入研究选择性集成算法的基础上,分别从选择、优化和聚类三个不同的角度对选择性集成算法进行改进,解决以下三个方面的问题:(1)动态选择性集成算法通常使用局部近邻样本来评估分类器的性能,使得由该方法构建出来的分类器模型预测准确率不高;(2)理论上来说参与集成的分类器个数越多,分类性能就越好,但是随着分类器的增多,导致分类器间可能由于分类性能相似产生若干冗余个体。因此需要研究在分类性能不降低的条件下,减小集成的规模;(3)基于K均值的选择性集成算法需要预先确定聚类数和随机选取初始聚类中心,使得该方法具有一定局限性。基于以上问题,本文主要工作如下:(1)提出一种基于特征加权的分类器动态选择与循环集成算法。新方法利用支持向量机度量出特征的重要性权值,根据不同的测试样本通过特征加权的K近邻算法寻找其较优的近邻样本,计算多个分类器对近邻样本的预测准确率,根据设定的误判容忍度阈值,择优筛选分类准确率较高的分类器,然后使用Kappa多样性度量再选择多样性较大的分类器,实现系统的循环集成。实验结果表明,相比于普通的动态选择性集成算法,新算法分类准确率更高。(2)提出一种结合多样性度量的启发式集成选择方法。首先,该方法将分类器间的多样性矩阵转换为邻接矩阵,以无向图的形式表示。其次,采取图着色算法实现分类器分组,再从每个分组中选择准确率最高的分类器形成候选分类器集合。最后,使用一种改进的模拟退火算法从候选分类器集合中选择出较优的分类器子集实现集成预测。实验结果表明,相比于传统的集成学习算法,新算法分类准确率更高。(3)提出一种基于自适应聚类的选择性集成算法。该算法使用混淆矩阵作为度量分类器间多样性的工具;然后使用最大最小距离的方法确定聚类中心,解决基于K均值的选择性集成算法随机选取聚类中心的问题;根据误差平方和变化率自动确定所划分的簇数,解决基于K均值的选择性集成算法需要预先确定簇数的问题。实验结果表明,与基于K均值的选择性集成算法相比较,本文算法表现出更优的分类性能。
其他文献
现如今,通信行业飞速发展,人们对通信传输也有了愈来愈高的需求,促使通信网络不断创新。而大规模多输入多输出(Multiple-Input Multiple-Output,MIMO)技术凭借其在系统容量和频谱利用效率的提升上具有的巨大的优势,被视为移动通信的关键技术。在大规模MIMO系统中,基于空间交替广义期望最大化(Space-alternating Generalized Expectation-
学位
多元化的高带宽业务如大数据、云计算、网络直播、远程医疗、线上教育等快速崛起,传统光网络中单芯光纤承载的业务传输速率不断逼近物理极限,对网络的容量和资源分配提出越来越高的要求。为了满足各类新型业务的需求,基于多芯光纤的空分复用弹性光网络受到广泛关注。空分复用弹性光网络具有高灵活性、高频谱利用率、大容量等优点,是未来光网络的长期发展方向之一,但是它也存在频谱碎片和芯间串扰等若干关键问题。为此,论文通过
学位
卫星通信系统凭借其在广覆盖、大容量及灵活性等方面的优势,以及能够为基站难以部署的偏远地区提供快速便捷的宽带接入,从而非常适合作为地面蜂窝网的重要补充,被认为是未来通信基础设施的一个重要组成部分。论文主要分析了几个典型应用场景下的多用户卫星通信系统性能,从而为系统设计提供参考和依据。论文的主要工作如下:1.针对基于放大转发(Amplify-and-Forward,AF)协议的多用户卫星前向链路传输系
学位
随着我国建筑行业的发展,施工工地人身安全问题日益凸显。此外人工智能芯片和深度学习技术的广泛应用,使得人工智能技术应用在嵌入式系统成为可能。本文根据亟待解决的安全施工和信息化管理需求,对基于嵌入式Linux的智能安全帽进行了技术上的研究与功能上的实现。首先,本文对智能安全帽课题的研究背景进行了介绍,简述了智能安全帽的国内外研究现状,调研了嵌入式人工智能设备的研发和应用现状。之后分析了智能安全帽的需求
学位
随着互联网的不断发展,用户可获取的信息种类数量越来越多,出现了“信息过载”的现象,推荐系统正是在这种大背景下而广泛发展,成为目前学术界和产业界热门的人工智能技术之一。同时全球各界对数据隐私的重视程度越发提高,大量隐私数据不允许被肆意传播,其导致了金融业、医疗业等重点行业产生“数据孤岛”现象,大量宝贵的数据很难及时用于研究。联邦学习为上述矛盾的解决提供了思路,其在保护数据安全的同时,提供了可靠的机器
学位
随着科技的发展,为了保障信息的安全,人们使用的密码技术也在不断更新。当前经典加密算法的私密性依赖于复杂的计算量,但随着破译机器性能的不断提高和解码算法的不断改进,破译时间也在不断减少,尤其在开启量子计算机的研发后,公钥加密算法的安全性变得愈发薄弱。以量子信息理论为基础,量子密钥分发(QKD)的出现提供了新的研究方向。QKD可以在监测窃听者行为的同时,实现合法通信双方之间的安全密钥分发。目前QKD协
学位
近年来,随着移动通信发展成为B5G和6G标准的新时代,近地轨道(Low Earth Orbit,LEO)卫星和空间互联网也成为研究热点。卫星数量的不断增加以及各种新服务的发展,将导致更多的频谱资源需求。然而,频谱作为不可再生资源,其短缺将严重限制卫星通信系统的未来发展。随着许多LEO卫星星座计划在Ku/Ka波段的实现,研究和分析地球同步轨道(Geostationary Earth Orbit,GE
学位
随着时代的发展,第五代移动通信技术(5th-Generation Mobile Networks,5G)网络面临多种多样的业务需求以及不断变化的复杂应用场景。国际标准化组织第三代伙伴关系项目(The3rd Generation Partner Project,3GPP)已明确5G移动通信系统增强移动宽带(Enhanced Mobile Broadband,e MBB)、超可靠低延迟通信(Ultra
学位
当前全球气候剧变,由此引发的空气污染问题日益严重,人们的日常生活受到了严重的影响。随着环保意识的逐渐增强,人们对于空气质量改善的需求越来越高涨,如何做好污染的防治工作成了一个十分急迫的问题。在保持经济高速发展的同时将工业化对环境气候的影响降低到最小,这已经成了各国学术界所共同追求的目标。采取科学的方法进行空气质量监控工作已经成了一项重要议题,准确地从空气质量数据中获取信息是这项议题的关键。掌握污染
学位
近年来面对全球不可再生资源日益短缺,价格大幅提升的社会现状,对太阳能等清洁能源的开发利用迫在眉睫。传统的太阳能电池受到光照条件的制约,且体积庞大,使用成本高昂,在一定程度上影响了太阳能电池的商用进程。针对这些问题,关于太阳能荧光集光器的研究被重新提上议程。太阳能荧光集光器由涂有或掺入荧光物质的波导结构组成,荧光物质吸收太阳能后发射更长波长的光,经过波导传输至边缘后被光伏单元转换成电能。太阳能荧光集
学位