【摘 要】
:
深度学习神经网络凭借其优异的表现,现在已经被研究应用到生活的各个方面。然而将当前的深度神经网络应用到实际场景中,对大量标记训练数据的需求已经成为一个挑战和瓶颈。对于现有的深度神经网络,从以前的训练任务中获得的先验知识很难适应训练样本较少的新任务。在这种情况下,少样本学习受到了广泛关注。有监督预训练是视觉识别中一种著名的训练方法,它赋予神经网络不同类别的识别能力。元学习是最近出现的另一种训练范式,它
论文部分内容阅读
深度学习神经网络凭借其优异的表现,现在已经被研究应用到生活的各个方面。然而将当前的深度神经网络应用到实际场景中,对大量标记训练数据的需求已经成为一个挑战和瓶颈。对于现有的深度神经网络,从以前的训练任务中获得的先验知识很难适应训练样本较少的新任务。在这种情况下,少样本学习受到了广泛关注。有监督预训练是视觉识别中一种著名的训练方法,它赋予神经网络不同类别的识别能力。元学习是最近出现的另一种训练范式,它提高了神经网络的泛化能力,能够更好地适应新任务,只需要很少的新样本。有研究指出在目前的少样本学习研究中,网络主要依靠的还是通过有监督学习预训练好的模型中对已有类的知识,而缺少了泛化性特征提取的能力和适应新任务的能力。在这项工作中,为了结合两种学习模式所带来的优势,并避免它们各自独有的缺点,本文利用元学习来微调预先训练的卷积神经网络主干,这在保持从普通有监督的预训练中获得的可辨别性的同时提高了泛化性。同时视觉Transformer在计算机视觉中获得了广泛的关注,并在各个子领域取得了优异的表现。因此,本文探究了如何将Transformer引入到少样本学习中。最后发现将Transformer结构引入到元学习中能够更好地提升网络在少样本学习中的表现。本文主要做出了如下贡献:(1)本文提出了一个拥有三个阶段的少样本图片分类的流程,分别是:预训练特征提取器,元学习微调特征提取器和多任务评价。前两个阶段是为了获得更好的特征提取器。多任务评价阶段是为了评测特征提取器,并使用有关算法使特征提取器更适合少样本学习任务。(2)本文在各个阶段提出了改进的算法。在预训练特征提取器阶段,本文探究了使用Transformer结构和卷积神经网络作为特征提取器时的模型表现。在元学习微调特征提取器阶段,本文将Transformer引入了元学习中,设计了一种新的方法对特征提取器进行微调。在多任务评价阶段,本文对提取后的特征进行了改善,本文使用了基于类别的注意力池化和多图块特征表示来改进一张图片的特征向量。(3)实验结果表明本文提出的方法能够有效地提升少样本图片分类准确率,并达到当前最好的效果。本文的方法在mini Image Net数据集上能够到达1-shot设定下68.18%,5-shot设定下83.43%的平均准确率。在tiered Image Net数据集上能够达到1-shot设定下72.40%,5-shot设定下87.20%的平均准确率。
其他文献
电话口译指译员借助电话或手机提供的一种远程口译服务。电话口译的时间、空间限制较小,对口译员的能力要求相对较低,具有便利性高、成本较低等优势。同时非言语信息的缺失、口译话题的不确定性,这些因素也给电话口译员的工作带来了挑战。戈夫曼的参与框架理论认为,会话参与者通常会拥有一到多种不同的身份,从而形成参与框架。参与者角色可分为发声者、作者和责任者,发声者不改变原话内容和形式,也不为说话内容负责;作者通常
作为影响力最深远、引入我国最早的口译理论,释义理论以及该理论的核心主张-脱离源语语言外壳假说无疑在指导口译教学与实践方面发挥了极大的作用,但即便如此,该理论仍存在诸多问题等待探讨。本研究从实际口译学习过程中遇到的问题出发,即汉英同传和英汉同传相比,学生普遍认为汉英同传难度更大,而且受母语形式的影响更大,英语词汇、句型积累的匮乏也导致他们在翻译时倾向于直译,很难做到摆脱源语形式,而这又和释义理论所主
自我评价和同伴评价在语言学习中有利于学生反思,提升学生自主学习能力,但其准确性和可靠性仍存在争议。目前,口译研究已开始关注自评互评这一话题,但相较于写作和口语评估研究,口译的自评互评研究略显不足。且已有研究较少关注语言和口译能力与评估能力的关系。对此,本研究招募了十二位被试,探究口译和语言能力对学生评价能力的影响,拟为口译课程设计和自评互评在口译课堂的实践提供建议。研究为期一学期的历时研究(共三次
无线自组织网络具有无中心、自组织的特点,最早应用于军事领域,后来扩展到灾区救援,临时通信等场景。作为无线自组织网络协议栈的关键组成部分,介质访问控制(Medium Access Control,MAC)层接入协议一直受到国内外学者的广泛研究。其中,带有冲突避免的载波监听多址访问接入(Carrier Sense Multiple Access with Collision Avoidance,CSM
大数据时代各种各样的信息喷涌而出。为了适应大数据时代,提高人们检索资料的效率,自动文本摘要技术成为研究的热点。自动文本摘要技术旨在用短小、简洁、凝练的句子表达源文本内容,是减少资源查找时间的有效手段。深度学习的发展使得对自动摘要技术的研究从抽取式摘要过渡到生成式摘要。生成式摘要模型的主流范式是编码器-解码器结构。编码器融合源文本信息,解码器利用编码器的输出生成摘要。这种方式更加符合人工生成摘要的方
计算机技术近几年取得的成就和对相关领域带来的影响有目共睹。其中教育是不能避开的话题,随着对优质教育均衡发展的重视,教育应用软件的作用也日益突出,手写体数学文本识别便是其中的核心部分之一。但是由于数学公式中存在分式、指数和根式等二维结构给混合文本的检测和识别带来了挑战,导致该领域在很长一段时间内进展缓慢。为此,本文以真实场景下的数学混合文本为研究基础,致力于解决混合文本的检测和识别任务。论文主要工作
机器学习模型的表现很大程度上依赖于数据量的大小。然而,随着隐私保护意识的提高,数据共享变得越来越困难。很多机构由于行业特点或利益关系,不愿共享数据,这降低了数据的使用价值,同时也对机器学习提出了更大的挑战。联邦学习框架的提出很好地缓解这了个问题,它可以让参与者在不暴露本地数据的情况下共同训练一个机器学习模型。在联邦学习中,参与者训练本地模型,将模型参数上传至服务器进行聚合,得到全局模型,以此达到使
水肿从气血论治验案二则湖南医科大学湘雅医院(410008)刘如秀功能性水肿是一种较常见的水肿,因其发病原因不明,故亦称原因不明性水肿。临床应用西药利尿剂水肿可减轻或消失,但停药后常反复,缺乏根治办法。刘志明老(中国中医研究院广安门医院主任医师)认为,...
随着协同和分布式应用场景的出现,群密钥协商协议广泛应用于群聊、网络游戏、社交网络应用等。群组密钥协商作为密码学中的一种基本原语,能够免去密钥分配时对安全信道的要求,因而需要群组成员各自贡献一个份额用于密钥协商,常见的群组密钥协商协议按密钥类型可以分为对称群组密钥协商协议和非对称群组密钥协商协议。基于椭圆曲线Diffie-Hellman的动态贡献群密钥协协议是一种高效的群密钥协商协议,可以抵抗被动攻