基于深度学习的小样本图像分类算法研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:wk4605300051
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前基于深度学习的人工智能算法已经在许多领域超越了人类,然而这类技术对数据的依赖性较高。在许多应用场景中,获取数据的过程面临着各种挑战,从而限制了深度学习算法在这些场景下的应用。因此探究在小数据量条件下训练可靠的深度神经网络具有重要的现实意义。小样本学习致力于解决数据稀少场景下训练模型的问题。在各类小样本学习算法中,基于度量的小样本算法性能较好。本文的研究问题为小样本图像分类,针对基于度量的小样本学习算法中数据匮乏、模型表征能力不足以及度量方式不准确等问题,从输入数据、特征编码模型、度量方式等角度出发对其进行改进。本文的主要研究内容如下:1.提出了基于对比学习和自注意力的小样本图像分类模型。该方法设计了一个监督对比块损失用于模型的预训练过程,该损失函数能够有效提升模型的泛化性能。此外,基于度量的小样本算法大多将图像压缩成特征向量,这种做法不仅丢失了图像的空间结构信息,还无法准确表示图像的前景物体。本文针对该问题提出使用特征图来度量图像间相似性,采用了自注意力机制对图像块进行匹配,确保模型能够准确对比关系相近的图像区域,从而做出更精确的预测。实验证明这两项改进能够有效提升小样本分类模型的性能。2.提出了基于视觉Transformer的小样本图像分类模型。该方法探究性的将视觉Transformer模型应用于小样本分类任务中。并通过分析自注意力机制和卷积操作之间的区别和联系,得出这两种操作方式的优缺点。据此设计了一种结合了卷积和自注意力机制的视觉网络模型。该模型能够同时编码全局特征和局部特征,模型的表征能力得以增强。实验结果验证了该视觉模型在小样本分类任务上的有效性,以及展示了各种视觉Transformer模型在小样本分类任务上分类结果。3.提出了基于多模态的小样本图像分类模型。该方法在预训练阶段引入代理任务辅助训练网络模型,通过这种方式增强模型的泛化能力。另外,本文提出使用多模态学习来解决小样本分类场景下数据稀缺的问题。具体而言,本文以原型网络为基础,设计了两种不同的特征融合方式对图像特征和文本特征进行融合,来增强特征空间内的原型表示,使得原型更具有代表性。实验结果表明,该方法能够有效提升模型在小样本分类场景下的准确率。
其他文献
单层六方氮化硼(h-BN)是一种宽禁带二维纳米材料,因其优异的力学、电学、光学特性广泛应用于微纳机电系统、光电器件、和场效应晶体管等领域。然而,h-BN材料在制备过程中难免会引入一些缺陷,从而影响材料性质。本文采用第一性原理方法,对本征及含空位缺陷单层h-BN的力学性能以及电学性能展开研究,主要研究内容和创新性工作包括:(1)采用第一性原理方法,研究了本征单层h-BN在不同手性方向受单轴应变的力学
学位
柔性离电式传感器具有灵敏度高、响应范围宽、稳定性高等优点,在可穿戴设备、柔性电子、便携式检测等领域表现出巨大的应用前景,受到国内外科研人员的重点研究。目前,柔性离电式传感器在灵敏度、响应范围等方面仍有较大的优化空间。本文提出一种基于二硫化钼的柔性离电式压力传感器,对其结构设计和制备工艺流程开展了较为系统的研究。论文的主要研究工作如下:(1)基于单层二硫化钼的赝电容特性和双电层电容传感机理,提出了一
学位
目前,随着工业自动化技术的不断提升和社会生活发展需求的逐步提高,人们对机器人系统的控制性能要求也越来越高,除了关注系统的稳态性能外,系统的瞬态性能也慢慢受到重视。预设性能控制可以同时保证系统的稳态和瞬态性能,即保证机器人系统在实现全局渐近稳定的同时,还能满足系统的瞬态性能要求。近年来,对机器人系统控制的稳定性、快速性和准确性要求也越来越高,因此对机器人系统的预设性能轨迹跟踪控制的深入研究也变得十分
学位
随着无人驾驶技术的不断发展,四旋翼无人机凭借体积小、机动灵活、便于安装调试等诸多优点受到了人们的广泛青睐。目前无人机室外飞行技术已经日趋成熟,但在室内未知环境中,由于GPS信号容易受到干扰,无法提供准确的定位信息,导致无人机室内飞行受到了极大限制。因此本文设计了一种基于多传感器融合的四旋翼无人机室内飞行平台,该平台能够实时获取飞行器的位置信息并构建出前向可飞行通道,实现室内走廊的自主飞行。(1)针
学位
近年来,数字产权的验证、盗版产品的追踪以及保证数据的完整性等安全管理变得越来越重要。数字水印是一个强大的安全工具,它可以保护数字产品的版权、验证产品的真实性等。传统数字水印基于物理学原理,缺乏严格的数学分析,所以密码学水印是一个值得研究的课题。现有的密码学水印方案大多都是给伪随机函数加水印。水印方案允许我们嵌入标记到原程序中,其需要满足的基本性质就是正确性和安全性。正确性需要水印标记后的程序和原程
学位
人类住宅和活动区域的电力消耗在全球能源消耗中占据了很大比重,因此在节能减排成为全球重要话题的当下,智能电网系统已经逐渐替代了传统电网系统,帮助促进科学用电以及提高电能利用效率。非侵入式负荷监测(NILM)是智能电网的关键组成技术,能够更加清晰、直观地了解住户的能耗使用情况,通过该技术不仅可以减少住户的能源浪费,为电网公司带来经济效益,而且可以为全球节能减排作出贡献。非侵入式负荷监测技术旨在通过从整
学位
图像描述生成可以对给定图像自动生成与其内容一致的自然语言描述,是一种跨计算机视觉领域与自然语言处理领域的交叉任务。在过去几年中,许多深度学习方法在非增量的图像描述生成任务中取得了非常好的效果。然而面对数据的爆炸式增长,传统图像描述生成方法在增量学习新知识时会遭遇灾难性遗忘的问题。考虑到人类有终身不断获取、调整和转移知识的能力,本文对增量式图像描述生成方法进行了研究。针对图像描述生成方法现有方法在持
学位
为了明晰外部情境与企业战略行动间的关系,通过对云南宽谷糖业有限公司的纵向追踪研究,引入战略认知构念,探讨新消费情境对战略行动演化的影响机理。研究发现:(1)新消费情境下新创企业的发展历程会经过单点突破、多元发展和场景延伸三个阶段,政策因素、技术因素与市场因素作为外部情境因素贯穿于上述三个阶段并驱动战略认知与战略行动的演化;(2)战略认知包含战略重心、认知互动和战略导向这三要素,传导新消费情境到战略
期刊
报纸
资源分配系统起源于计算机科学,目前已经在各个领域被广泛研究。医疗装备,如各类样本检验分析仪器及其共同构成的医学自动化分析系统,由于在运行过程中需要使用多种分析试剂,也被认为是一类资源分配系统。本文工作以医疗装备为应用背景,使用Petri网模型研究资源分配系统中资源时间和成本的建模分析问题。在资源分配系统日益复杂化的今天,经典Petri网在建模描述复杂系统能力方面呈现出诸多不足。因此,必须对经典Pe
学位