【摘 要】
:
近年来,深度学习在诸多领域都取得了很好的效果,不过其最大弊端,就是学习过程中需要大量标注好的训练数据,而这会消耗很多的时间和精力。零次学习能够较好的解决这个问题,它通过标注好的可见类的训练集和关于不可见类与可见类语义相关的知识进行学习训练,使得模型能够识别出训练过程中未出现的类别样本。零次学习中有视觉特征与语义特征,这两种特征能否较好地表示相应类别对最后的分类结果有很大影响。因此对特征本身的优化非
论文部分内容阅读
近年来,深度学习在诸多领域都取得了很好的效果,不过其最大弊端,就是学习过程中需要大量标注好的训练数据,而这会消耗很多的时间和精力。零次学习能够较好的解决这个问题,它通过标注好的可见类的训练集和关于不可见类与可见类语义相关的知识进行学习训练,使得模型能够识别出训练过程中未出现的类别样本。零次学习中有视觉特征与语义特征,这两种特征能否较好地表示相应类别对最后的分类结果有很大影响。因此对特征本身的优化非常重要,尤其是语义特征,因为类别的语义特征大多是人为定义的,不可避免的会存在对图像描述不够准确的问题。另外零次学习还需要将语义特征与视觉特征映射到相同的维度空间,这是零次学习中的关键,不同的映射方式对最终的结果影响很大。本文在对现有工作研究分析的基础上,提出了相关双自编码器方法和基于知识图谱的零次学习方法,主要研究内容如下:(1)针对语义特征对图像描述不够准确的问题,本文提出了相关双自编码器的模型架构。本文对视觉特征与语义特征分别建立了自编码器,这两个自编码器是有联系的,视觉特征自编码器产生的结果会影响下面语义特征自编码器的编码解码过程。这么做能使语义特征中包含图片的视觉信息,使语义特征能更完整更细粒度地描述图片,从而起到提高识别分类准确率的作用。(2)类别之间的连接关系能帮助学习到一些隐藏的语义特征,从而能够更好地与视觉特征进行映射,所以本文利用Word Net知识图谱来构建类别之间的关系图,引入额外的先验知识。然后利用图网络算法Graphsage对关系图进行学习训练,不断吸收学习相邻节点的信息,使得关系图中节点有更完整的语义描述。因为引入了图结构,所以本文通过图卷积神经网络将语义特征映射到与视觉特征相同的维度空间。此外,本文还利用了直推式的学习方式,将测试集中的图片也引入到训练的过程中,这样能让学到的知识更好地从训练集类别迁移到测试集中的类别,能很好的减少过拟合。本文将这两个模型在Aw A、CUB和Image Net数据集上进行了大量的实验,取得了比之前一些模型更好的结果,其中第二个模型方法有着更出色的表现。
其他文献
非线性波动方程是偏微分方程中的一个重要研究领域。在物理问题中,非线性,色散及耗散这三种因素影响着弹性杆内波的传播。其中,非线性项会使波前变陡甚至破裂,而色散与耗散可以减少波前斜率,制止波发生破裂,从而使弹性杆内波产生最终的稳态。本文共分为三章讨论带有双色散项的非线性发展方程(组)的初边值问题。本文第一章介绍了带有双色散项的非线性发展方程(组)的问题背景。本文第二章用Galerkin方法研究了一类带
特种设备安全作为安全生产工作的一个重要组成部份,关系经济社会发展和国家的稳定,联系着人民群众的生命和财产安全。研究分析基层特种设备安全监察工作现状与普遍性问题,并
在外语阅读过程中,焦虑作为一种常见的情感因素可能会阻碍学习者获取外语信息。本研究以二语习得理论和外语焦虑相关研究为指导,结合自己的教学实践,对小学六年级学生英语阅
传统防火墙是一台真实物理服务设备,主要控制网络中南北向流量;虚拟防火墙如同具有安全服务的特殊虚拟机,拥有独立的管理员、系统资源、用户认证、安全策略、数据库等。传统的防火墙部署缺陷和应用的不足是虚拟化防火墙产生的关键之一。访问控制系统是防火墙的最中要的组成部分,为了满足用户在不同时间段允许或禁止访问网络资源,访问控制系统中配置防火墙策略时引入了时间的限制,由于时间的增加导致防火墙策略之间存在的冲突类
在WSON骨干传送网中,业务沿着光路径传输会经历各种损伤,这些损伤随着信号传输距离的增大逐渐累积,造成光信号传输距离受限问题。光信噪比(OSNR)是衡量光网络信号传输质量的重要指标。目前WSON骨干传送网中应用最多的物理损伤补偿方式是设置电中继。电中继是建网中的主要成本,合理中继节点的选择及合理的中继方式可大大降低建网成本。为此本文提出了一种基于物理损伤的WSON骨干传送网中继算法(RA),该算法
当前,中国经济已由高速增长转向高质量发展阶段,正处于转变发展方式、优化经济结构、转换增长动力的攻关期。政府加快落实减税降费政策,优化市场环境,激发市场活力,推进经济的高质量发展。企业作为市场经济中最活跃的主体,企业积极转型创新,提升产品质量,清洁绿色发展,承担好各个利益相关者的社会责任,对于促进经济提档升级,实现经济的高质量发展意义巨大。但是,我国企业目前的社会责任实践情况不佳,企业失责事件频发,
随着遥感技术的飞速发展,其越来越多的被应用在国防安全、国土规划、农业和金融等多种领域。对遥感图像进行合理有效的土地覆盖类型识别是诸多应用的基础。应用特征提取与分析的图像处理手段进行土地覆盖类型识别面临着图像特征提取复杂、缺乏泛化性和成本较高等缺点。近年来伴随着深度学习的发展,语义分割技术带来了一种研究土地覆盖类型识别的新视角。深度学习针对大数据自动学习特征,在语义分割的一些应用中取得了出色的成绩,
在经济发展和新社会阶层逐渐形成的背景下,不同阶层具有不同的体育价值观,因此在体育活动和社区体育公共服务的需求方面也不尽相同。另外,在特定的经济发展态势下,针对多类群
协同过滤算法作为一种广泛应用的推荐算法,受到了人们的青睐,它通过利用用户对物品的历史评分等有关信息来预测物品的评分,向目标用户生成推荐列表。基于矩阵分解的推荐算法通过将评分矩阵分解为用户特征矩阵与物品特征矩阵来计算预测评分,但并没有充分挖掘用户与物品的属性信息,为此,本文提出了一种将矩阵分解与神经网络结合起来的方法,并加入属性信息以提高预测精度。信息核是数据集中少数但却有着关键信息的用户,真实信息
弯曲菌(Campylobacter spp)是一类能够引起人类腹泻的人兽共患病病原菌。在已发现的弯曲菌种类中,空肠弯曲菌和结肠弯曲菌是引起人类腹泻的主要致病菌,90%以上的病例由这两种病原引起,而其中空肠弯曲菌和结肠弯曲菌分别约占90%和10%。传统生化方法在鉴定弯曲菌时存在步骤多、耗时长、通量低等问题,而PCR方法试剂昂贵,且实验步骤多,容易产生样本间的交叉污染,从而导致假阳性和假阴性结果。近年