基于跨模态信息迁移的小样本方法研究

来源 :合肥工业大学 | 被引量 : 0次 | 上传用户：a5823869

【摘要】

：

【作者】

：

付炳光

【机构】

：

合肥工业大学

【出处】

：

合肥工业大学

【发表日期】

：

2023年01期

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

近年来深度学习快速发展并攻克了计算机视觉不少难题,然而这些成果通常是建立在大量标注数据的基础上。大量标注数据意味着高昂的成本,且许多应用由于标注数据不足而难以落地。小样本学习旨在通过少量标注数据训练得到一个性能良好的模型而成为受许多人关注的领域。在图像分类任务中,现有的大多数小样本方法仅利用样本视觉信息,而忽略与之相关的文本信息。事实上,在视觉数据较少的情况下,引入其他模态信息并合理运用有助于提升视觉任务模型性能。据此,本文主要研究内容如下:1.阐述了小样本学习的研究背景以及意义,将该研究方向的方法大致分为基于参数优化的方法、基于数据增强的方法和基于模型的方法,随后介绍属于这些方法类型的多模态小样本方法,并对这些方法进行详细地分析与评估。2.图像标签语义特征不仅包含标签信息,还蕴含了语料库词汇间的联系,且实例的图像信息和文本描述信息之间具有一定的互补性,一方缺失的信息可能在另一方得到弥补。因此,本文设计了基于混合语义的图神经网络小样本分类方法,使用图神经网络挖掘图像特征之间的联系,并利用早期图像特征和补充词汇增强语义特征的表达能力,最后组合两者构造多模态特征用于小样本图像分类。在多个数据集上该方法均取得了较高的准确率,验证了该方法的有效性。3.在度量学习小样本中,由于训练样本和测试样本存在分布差异,通过训练样本学得的特征嵌入空间并不一定适用于识别测试样本。针对此问题,本文提出了特征注意力适应小样本分类方法,利用上下文注意力对最适合当前分类任务的特征维度进行加权,并利用文本信息作为先验知识调整损失函数中不同类的相似度系数,使得模型学习到更具有辨别性的特征。通过实验验证了上下文注意力和调整相似度系数方法的有效性。

其他文献

ZigBee和WiFi的双向跨协议通信技术研究

随着物联网技术的飞速发展,出现了大量的物联网异构设备的共存问题,也产生了不同协议的无线设备之间互相通信的需求。传统的方法是利用物联网网关,物联网网关配备了多个无线接口,为不同技术进行协议转换,实现异构物联网设备之间的间接连接。然而,物联网网关需要接收和发送不同的信号,引入了额外的硬件成本和信道资源占用。因此,研究者提出了跨协议通信技术（CrossTechnology Communication,C

学位

基于零样本学习的轴承复合故障诊断方法研究

旋转设备故障诊断是保证设备可靠运行的重要研究内容,轴承复合故障诊断由于其特征高度耦合,故障类型繁多,是故障诊断中的难点问题。现有的复合故障诊断方法多需要获取大量的复合故障样本进行信号分析或者模式识别,考虑到实际工况中,轴承的单一故障样本比较容易采集和标注,但复合故障的样本却难以获取且难以标注。本文从单一故障样本与标签的约束条件入手,研究复合故障样本识别的新方法,提出基于零样本嵌入模型的复合故障诊断

学位

基于深度学习的骨龄评估方法研究

骨龄评估（Bone Age Assessment,BAA）作为儿童健康成长的重要组成部分,可以直接反映出儿童的生长发育情况,得到了人们的广泛关注。儿童骨骼的生长发育过程是连续的、阶段的,并具有具有一定的规律性。因此,专家可以利用手部X光片判断出儿童骨骼的生长发育情况,并对遗传性和内分泌疾病进行相关诊断。此外,骨龄评估还可以用于特殊人才的选拔和作为罪行推定的依据,在体育、法律等领域也发挥着重要的作用

学位

基于注意力机制的上下文主题对话生成

在人工智能广泛应用的今天,对话系统作为自然语言处理的一大分支,或已成为衡量人工智能发展程度的一大标准。在对话系统的发展过程中面临着多种困难,如在多轮对话生成工作中如何将对话的历史信息更好的在生成中体现以及在对话生成过程中如何避免主题缺失等现象。在本文的研究中,旨在解决在开放域多轮对话生成过程中缺乏上下文信息和主题缺失的问题,论文研究了一种基于层次注意力机制的上下文主题对话模型。本文的主要工作如下:

学位

基于视觉伺服的光束定向系统设计与实现

在EAST托卡马克装置上,采用了多种可见光光学诊断设备监控等离子体的状态。为了保证这些光学诊断设备的准确性,需要对其光束空间方向进行校准,而在狭窄的真空室内进行人工校准是不可接受的。为了解决这个问题,本文设计一种基于视觉伺服的光束定向系统。将一个专用的相机采集模块安装在新松GCR5-910机器人的末端,用于获取光斑中心点的像素坐标,经过坐标变换和空间直线拟合算法拟合出光束的空间方向。同时使用视觉伺

学位

区块链中分片交易分配和多副本区块放置问题的研究

近年来,区块链技术越来越受关注,区块链技术也得到了多方面的发展。但是,区块链面临低吞吐量和低存储扩展性的瓶颈。分片技术可以提高区块链的并发吞吐能力,但现有的交易分配方法不能有效提高区块链的收益。多副本区块方法为一个数据块设置多个副本,并将每个副本存储在不同的节点中,相比区块的全复制方法,多副本方法有效降低了节点的存储开销。但现有的区块链多副本方法忽略了区块的查询代价。针对这些问题,本文分别研究面向

学位

基于点云位姿估计的运行管理系统设计与实现

托卡马克核聚变堆在运行的时候会产生大量热能、辐射能、电磁场以及中子流,多数情况下都无法进行人工维护。因此需要使用遥操作控制系统对托卡马克装置内部进行维护和操作。在遥操作上层控制系统中需要采集多种数据来对任务进行创建。采集机械臂数据可通过示教来进行,将数据存储到遥操作上层控制系统的运行管理子系统数据库中。但示教采集信息的方式效率低,在目标位置发生变化后就要重新示教,而且在聚变堆运行后装置内部情况不允

学位

局部因果学习驱动的多标签特征选择研究

多标签特征选择在高维多标签学习任务中起着至关重要的作用,并被广泛用于文本分类,Web数据挖掘等领域。现有的多标签特征选择方法主要是探索特征-标签、特征-特征和标签-标签的相关关系中的两种,少数方法能够同时处理三种类型的相关关系。如果能够同时考虑三种相关关系,可以获得带有更多辨识信息的特征子集,用于构建性能更加优越的预测模型。为了解决这个问题,本文将多标签特征选择问题转化为局部因果结构学习问题,围绕

学位

基于预训练语言模型的实体识别及其优化方法研究

知识图谱是一种用来描述现实世界实体之间相互关系的知识库,其已在搜索、推荐和问答领域得到广泛的应用。大规模的知识图谱难以完全依靠人工构建,因此自动化的构建知识图谱成为了研究的热点问题,其中命名实体识别是构建知识图谱的基础任务之一。目前,基于Transformer的预训练语言模型在解决命名实体识别任务上得到广泛的应用,但这类方法通常需要高质量的标记数据进行微调,难以在无监督或弱监督的情况下实现较好的命

学位

基于约束的高效局部贝叶斯网络结构学习算法研究

贝叶斯网络是不确定性知识表达与推理的重要工具,是数据挖掘、人工智能和机器学习等领域中的重要研究方向之一。在大数据时代,由于数据的高维度,学习整个贝叶斯网络结构是一个耗时甚至不可能在有限时间内完成的任务,这使得学习一个给定变量的局部贝叶斯网络结构成为一个新的探索方向。然而目前的局部贝叶斯网络结构学习算法仍存在很多问题需要进一步探索,因此,本文开展基于约束的局部贝叶斯网络结构学习算法的相关研究,主要取

学位

基于跨模态信息迁移的小样本方法研究

与本文相关的学术论文