基于小样本学习的近邻加权原型分类算法研究

来源 :吉林大学 | 被引量 : 0次 | 上传用户:k55551309787
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,深度学习领域取得了许多引人瞩目的成就,深度学习模型大量的应用于多种实际场景中。但在实际的应用过程中,深度学习算法往往需要成千上万个有监督的样本,以此来保证模型的学习能力,而获取这些符合相关标准的样本十分耗费人力、物力。因此,在实际样本量很少的情况下,以往的深度学习模型难以胜任。小样本问题正是由此而来,其目的旨在通过一个或者几个示例就能使得模型轻松建立起对新事物的认知。小样本学习是针对具有少量样本的数据集进行学习。数据集中每个类别仅含有几个带标签的样本,然后根据任务进行分类、识别或检测。在小样本学习中,一个关键的挑战是最大限度地利用几个有限的数据,找到任务所需的正确描述或分类。原型网络是一种基于度量的小样本学习分类算法,但原型计算方式简单,不能反映出各个样本间的差异性,本文在原型网络的基础上,对样本原型的计算、网络结构优化等关键问题进行了研究,主要工作如下:由于各个类别中样本对原型的贡献不同,针对同类样本与相似类的样本对度量空间下各类分布的影响不同,提出了一种近邻加权原型的思想。在原型网络中,原型是通过对每个类别中的样本特征向量平均得到的,即认为各个样本对原型是同等重要的。但显然,同一类样本也是不一样的,样本具有多样性的特点,在原型计算过程中,质量高的样本应当占有更大的权重。本文提出的近邻加权原型网络NIPN以同类、相似类近邻样本点的间距为基础,计算了度量空间上每个类别中样本占有的权重,进而采用加权的形式计算出每类更具代表性的原型,同时增大了相似类之间在度量空间上的距离,从而提高分类的准确率。为了进一步提升小样本分类性能,针对数据集中样本的目标及背景中存在的噪声干扰所带来的性能损耗,本文引入了注意力机制,结合通道注意力机制来判别特征图各通道重要性,并依据不同大小的感受野所能提取的空间特征的差异,来判别特征图不同空间位置的重要程度,构建了多核通道注意力网络A-PN,对特征提取网络的结构进行优化,使模型在学习的过程中更加关注感兴趣的区域,以减少噪声的干扰,从而提升小样本分类准确率。实验表明:在5-way 5-shot任务中,近邻加权原型网络NIPN将基于基准数据集Mini-Image Net和CUB的小样本分类平均准确率分别由72.64%和84.76%提高到75.29%和86.65%,在提高准确率的同时,仅增加了1.11%的计算开销,近邻加权原型网络NIPN极具竞争力;多核通道注意力网络A-PN将小样本分类的平均准确率由72.64%提高到73.14%,提高了卷积神经网络的特征提取能力,在学习训练过程中,更加关注重点区域。本文的研究提出了近邻加权原型算法并且构建了更好的特征提取网络,在两个基准数据集上的实验结果表明了该模型对基础模型优化的有效性,比现有的一些小样本分类方法更加优越。
其他文献
青光眼是当今排名第二的致盲性眼病,更是不可逆性致盲眼病之首。在病变过程中,患者视力水平往往是渐行性且不可逆的缓慢损伤,绝大多数患者无明显症状,直至视力遭受严重损害后才能发觉,因而青光眼又被称为“沉默的视力窃贼”。青光眼无法预防,只能通过及早发现、及早治疗,进而阻止病情继续恶化,这一举措可以有效降低患者的失明率。但目前眼科医生数量依然匮乏,尚无力支撑大规模的青光眼筛查。在临床检测中,医疗影像可以有效
学位
据相关研究调查显示,高血压、糖尿病等慢性疾病在近年来呈快速增长趋势,临床医学研究发现这类疾病症状表现与视网膜密切相关,视网膜血管的异常扩张或阻塞、炎症反应等症状为医生的诊断提供了重要的依据,计算机图像处理技术为诊断提供了新的思路,本文旨在研究一种辅助医生诊断的眼底图像分割方法。近年来,卷积神经网络被大量应用于图像处理任务中,依据特定的分割任务来设计网络框架能达到良好的分割效果。利用U-Net网络架
学位
精准施肥是精准农业重要的一环,也是推进建设农业现代化的核心之一。对于土测含量和产量与施肥量之间的复杂非线性关系,传统的精准施肥手段常常难以得到准确的目标预测值。且获取实际农业数据所需周期长,获取到的实际样本有数量少,不平衡的特点。为解决上述问题本文提出了基于贝叶斯回归网络的同构集成和异构集成学习方法,贝叶斯分析是一种经典实用的统计学方法,在许多领域广泛应用。这种方法可以结合先验信息和全部样本的数据
学位
在信息全球化的大背景下,移动通信的发展突飞猛进,云计算、区块链、大数据等创新技术极大地改变了人们生活、工作与交流的方式,同时,随着5G+垂直行业的新型服务及应用不断出现,如:自动驾驶、智能家居、远程医疗等,人们对网络传输速率、网络可靠性等性能提出了更高的要求,因此,需要多种制式网络相融合来促进网络的“互联互通”体系。为了实现异构网络间无缝漫游,5G多连接技术成为国内外的研究热点,使用户设备同时与多
学位
人机交互方法在大量以陆地为主要背景的数据集上取得了令人满意的研究成果,但目前该领域的研究几乎全部集中于陆地环境。本文期望能够丰富人机交互领域中单一的研究环境,在特殊的水下环境中完成面向潜水员与机器人间的交互研究。然而水下环境固有的不稳定性导致很少有针对水下人机交互而专门构建的数据集,同时也限制了相关工作的发展。如何针对该领域展开潜水员和水下机器人之间的交互研究是一个具有挑战性的问题。考虑到声呐、电
学位
光纤激光器具有结构紧密、光束质量好、转换效率高等特点,被广泛应用于国防事业和工业制造。随着制造领域的精密化演进和国防事业的进一步发展,更高功率和更优良光束质量的光纤激光器的需求与日俱增。虽然单个光纤激光器可以通过优化结构的方式获取较高功率的输出,但受光纤非线性效应和热损伤等因素的制约,其提升是有限制的。为解决这一问题,激光合束技术应运而生,可以通过将几个中等功率的激光器进行合束,获取更高功率的激光
学位
LED现已成为室内照明的主流技术,基于LED的可见光通信(Visible Light Communication,VLC)由于频带宽、保密性强、绿色安全等优点,被认为是下一代无线网络中室内专用通信的最佳候选对象。光学相机通信(Optical Camera Communication,OCC)技术作为VLC的分支技术,在继承其优点的同时,又因其接收设备的高普及率、低成本而受到广泛的关注。在已有的基于
学位
随着第五代移动通信的快速部署与发展,传统无人机产业正快速向网联化、数字化和智能化方向发展。使用全球无所不在的蜂窝网络取代传统点对点通信链路的网联无人机,可以不受地形和距离限制地远程操控和数据传输,提供了全天候在线服务并具备综合监管能力,大大提升了无人机的服务性能与应用领域。目前网联无人机正广泛应用于电力巡线、公安巡逻、交管巡查以及农业、物流和勘探测绘中。5G+无人机模式正全面赋能我国各行业的发展建
学位
关系型数据库是指使用关系模型存储数据的数据库,一般使用SQL(结构化查询语言)操作其中数据,应用时通常作为数据存储端存在于应用系统,开发者需根据使用需求定义操作指令,据其生成SQL语句执行数据库操作。传统数据库应用中操作指令的定义通常由命令式编程和面向对象编程完成,相当于在SQL的基础上再添加另外一些规则约束才能执行对数据库系统的操作管控。面对操作指令中操作条件的变更,传统数据库应用需要对应用系统
学位
增强现实技术和V2X预警技术是当下新型技术的两个研究热门,现在已有将增强现实显示技术融合到汽车的抬头显示器上,对驾驶员进行安全预警,从一定程度上提高了驾驶员的驾驶环境安全和驾驶体验。本文通过使用增强现实眼镜实现V2X预警功能,旨在设计并实现一种新型的可以全方位对驾驶员进行V2X预警功能的便携式设备,实现当驾驶员佩戴眼镜时,无论驾驶员看向何方都可以无死角的对驾驶员进行预警提醒。系统首先是车辆感知单元
学位