【摘 要】
:
深度学习作为新兴人工智能技术,在计算机视觉、自然语言处理等多个领域中占据领先地位。它依靠大规模带有标签的样本数据进行长时间的训练,从而获取具有高性能的模型,其性能远超传统算法。然而,在深度学习的众多实际应用中,获取大量带标签的样本数据很困难或者代价很高。在这种场景下训练模型,其泛化能力就会大大折扣。因此,适用于少量带标签数据场景的小样本学习便成了人工智能研究人员需要重点突破的任务。度量学习是小样本
论文部分内容阅读
深度学习作为新兴人工智能技术,在计算机视觉、自然语言处理等多个领域中占据领先地位。它依靠大规模带有标签的样本数据进行长时间的训练,从而获取具有高性能的模型,其性能远超传统算法。然而,在深度学习的众多实际应用中,获取大量带标签的样本数据很困难或者代价很高。在这种场景下训练模型,其泛化能力就会大大折扣。因此,适用于少量带标签数据场景的小样本学习便成了人工智能研究人员需要重点突破的任务。度量学习是小样本学习中一种具有代表性的方法,特征嵌入网络的表达质量和度量方法对其性能影响较大。本文分别从改进特征嵌入网络结构和类别度量方法两个方面提升模型的性能。本文的主要内容有:(1)对于度量学习中的特征表达不足的问题,考虑到现有的卷积神经网络在特征嵌入时未能有效地利用特征的通道和空间信息。本文在原型网络的基础上,提出了基于空间和通道注意力机制的小样本学习网络模型CBAM-Proto Net。通过将CBAM与原型网络模型相结合,在特征嵌入网络学习样本的特征表示时,利用空间和通道注意力机制让特征嵌入网络能够更多地关注对决策有帮助的特征信息,从而提高特征图的质量并提升模型的分类性能。CBAM-Proto Net算法在基准数据集CUB-200、mini-Image Net上进行了多组对比实验。在5-way 1-shot和5-way 5-shot模式下,改进后的模型在CUB-200数据集上分别提高了6.10%、2.43%,在mini-Image Net数据集上,分别提高了2.76%、1.92%。改进后的模型性能有较大的提升,表明了CBAM的有效性。(2)针对在度量学习中采用余弦相似度作为类别度量模块时模型分类效果不佳的问题,鉴于现有的度量方式过于简单,不能有效抓取不同特征的区别性。本文引入了EMD模块,提出了基于搬土距离的小样本学习网络模型CBAM-EMD。在对样本特征间的差异性进行比较的度量阶段,利用搬土距离取代传统的余弦相似度函数,将度量问题转换成线性规划问题,通过EMD模块计算图像特征嵌入之间的最优匹配代价,使用最优匹配代价来表征图像之间的差异性,进而根据最优匹配代价越小其类别越相似的规则完成分类。本文对其做了个多个对比实验。在5-way 1-shot和5-way 5-shot模式下,改进后的模型在CUB-200数据集上分别提高了10.87%、3.65%,在mini-Image Net数据集上,分别提高了4.76%、2.40%。改进后的模型性能有较大的提升,表明了EMD模块的有效性。且在与多个模型对比实验中性能取得领先地位,证明了算法的有效性及较强的泛化能力。同时,本文还做了模型跨域鲁棒性测试,在多个算法中,CBAM-EMD算法跨域衰减率最低,证明了算法具有较强的鲁棒性。
其他文献
在无线传感器网络中,覆盖控制的研究可以提高资源利用率,延长网络周期,提高感知服务质量,增强直接、有效、真实地访问数据信息的能力。无线传感器网络应用于多种场景下的监控和收集数据,这些过程不可避免地会涉及到路由、位置和覆盖等问题。由于传感器节点的部署不会长时间随机变动位置,则通过异常检测技术对传感器节点进行监测,以此来判断地下水管道的安全状况,及时对地下水管道进行维修和节省劳动成本。本文通过在地下水管
如何快速、准确地获取土壤成分信息的技术,是开展测土配方、精准施肥以及研究植物生长周期的基础,对有效统计土地资源、精细化林业生产都具有重要的作用。高光谱分析是一种通过解析物质光谱特征数据、挖掘数据深层信息,进而对物品分类或对物质的化学组成成分定量分析的技术,高光谱的优点主要体现为成本低廉、快速测量、远距离无接触预测等。在快速获取土壤成分信息的过程中使用高光谱分析技术可以降低信息获取成本,对测土配方精
<正>慢性炎性脱髓鞘性多发性神经根神经病(chronic inflammatory demyelinating polyradiculoneuropathy,CIDP)是一类常见的获得性免疫介导的周围神经病,其临床表现多样,治疗反应不一[1]。血清抗神经束蛋白155免疫球蛋白(neurofasicin 155,NF155 IgG4)抗体即是其中之一,NF155抗体相关的CIDP约占7%,抗体以Ig
随着5G通讯技术和物联网技术的飞跃式进步,定位导航技术在导航、医疗等领域中都有着至关重要的作用,在生活中通过手机等智能便携设备来获取人们的位置信息,已然成为了当代人生活的日常,室内定位也逐渐成为了人们的硬性需求。而机器学习所具备的高纬度建模能力,能够解决很多传统模型在复杂的室内场景下难以处理的问题。因此本文基于机器学习所具备的优势,重点研究了K近邻(K nearest neighborhood,K
随着电力电子技术发展水平的快速提高,电机调速系统在军工业、农业乃至日常生活中都得到了广泛的应用,永磁同步电机(Permanent Magnet Synchronous Motor,PMSM)是一种交流电源设备,因其特殊的内部构造有体积小、质量轻、使用寿命长等特点,并且PMSM调速系统具有响应速度快、准确、调速范围宽等优点,这让PMSM在精密数控机床、智能机器人、航天航空等领域展现出其调速系统的优势
近年来,随着人工智能技术逐步渗透到国防、教育、金融等各种各样场景,人工智能技术在为人们提供便利的同时也暴露出大量的隐私安全问题。特别是针对深度学习的反转攻击变得越来越频繁。反转攻击是攻击者利用受害者模型能够“记住”训练数据特征的特性,通过使用非法手段,获取受害者模型训练数据信息的攻击手段。如基于自动编码器的反转攻击模型。在模型训练过程中,它假定攻击者能够访问数据本身,并利用均方误差方式窃取训练数据
多目标优化问题普遍存在于工程领域和科学研究中,且往往面向复杂环境,形成约束多目标优化问题。多目标进化算法具有一次获得一组可行解、不依赖问题的特性,其结合约束处理技术形成约束多目标进化算法,被广泛用于解决约束多目标优化问题。近年来,已开发出多种约束处理技术并成功应用求解约束多目标优化问题。在解决约束多目标优化问题时,目标和约束之间的平衡至关重要。然而,约束条件会使许多可行区域变得不可行,并呈现出一些
城市下水管道破裂、渗漏等问题会严重影响城市居民日常生活,缺陷检测是管道健康等级评估最重要的环节之一。人工判读的方式费时费力且过于依赖专家经验,而基于传统的计算机视觉的检测方法需要对特征提取器与分类器的设计要求高且只能检测特定的缺陷类型。近年来,随着深度学习在计算机视觉领域的快速发展和管道图像样本数量的增加,本文对基于深度学习的管道缺陷检测进行研究,主要的研究工作如下:(1)设计了一个分层的网络架构
在我国大力实施“双创”的背景下,大学生已经成为“双创”的重要力量,如何科学、有效、系统地培养大学生的创新创业能力,应当引起高校和企业的高度重视。在组织实施的过程中,应当将校企协同人才培养模式与培养大学生创新创业能力进行有效融合,只有这样,才能促进大学生全面发展。本文对此进行了研究和探讨,在简要分析“校企协同”模式对培养大学生创新创业能力的重要价值的基础上,重点分析了“校企协同”模式下培养大学生创新
微生物与人类的生活息息相关,测序技术的发展使得微生物宏基因组学跨入新的发展时期,基于高通量技术扩增的生物学实验产生了大量16S r RNA(16S ribosomal RNA)序列信息,对产生的16S r RNA序列进行数据分析是生物信息学上一项严峻的挑战,其中一项主要的技术就是将16S r RNA序列进行聚类,从而分析环境中菌群物种丰度及多样性。目前,已经存在很多种不同的聚类算法,且均可实现有效