应用导向的广义零样本识别方法

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:wandd_wind
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
零样本学习技术是解决目标识别领域所面临的大数据依赖问题的有效手段,其通过人为引入的诸如属性或者词向量的语义知识建立起可见类和不可见类间的数学联系,从而完成零样本识别。零样本学习可分为早期的传统零样本学习和新兴的广义零样本学习,其中前者仅需识别不可见类,而后者则需同时识别可见类和不可见类,更具应用价值。零样本学习方法又可分为嵌入式模型和生成式模型两类,其中嵌入式模型可实现端到端的训练模式,结构简明,但在广义任务上会引起严重的分类偏误问题,即容易将不可见类误分为相似的可见类;生成式模型虽然能一定程度避免分类偏误问题,但训练过程繁琐,需要引入额外的语义先验,不利于应用。因此,本文致力于解决嵌入式模型在广义任务上面临的分类偏误问题,构建应用友好型的零样本学习网络,该研究具有一定的理论价值和较高的应用价值,其中三个工作重点总结如下:首先,本文对目前少有研究的分类偏误问题进行了数学建模,并提出了局部相对距离作为其度量标准,越小的局部相对距离意味着越严重的分类偏误问题。同时,本文依据该度量标准进行数学分析和证明得出了一个重要结论:提高映射的局部线性能力能够增大局部相对距离从而有效缓解分类偏误问题。然后,本文依据该结论设计了语义协同表征网络。该网络为可进行端到端的训练的嵌入式模型,主要包含三大模块:用于语义表征的协同模块,用于相似性度量的比较模块以及用于图片特征提取的卷积神经网络模块。其中,协同模块采用了一种“分解求和”的思想有效增大了局部相对距离,在提高局部线性能力的同时保留了全局非线性能力,是解决分类偏误问题的关键。同时,本文设计了一系列面向属性输入的应用实验,结果表明该网络有效缓解了分类偏误问题,在采用更少的语义先验的情况下性能超过了现有最优的生成式模型方法。进一步分析表明协同模块能够学到更具判别性的特征和更加均匀的嵌入空间,且整个网络易于实现,具有良好的鲁棒性。最后,本文将单模态的属性输入拓展为属性加词向量的多模态输入,并提出了基于模型集成的后端融合和单模型的前端融合两种多模态融合方法,进一步提升了网络性能。其中前端融合方法充分利用了语义协同表征网络的“协同”特性,对协同模块进行了高维拓展,将多个专家模块组成专家组模块,每个专家组模块负责特定模态的映射,其性能提升幅度更大,也表明了语义协同表征网络的高兼容性和可拓展性。
其他文献
随着“中国制造2025”战略与工业4.0间的对接及二者的不断推进,国内外制造型企业开始加快探索制造业智能升级的步伐,而信息物理融合系统(Cyber-physical System,CPS)则处于其中的核心地位。作为一个包含复杂结构与功能的高级嵌入式系统,CPS的建模与分析逐渐成为当前的热点研究问题。现有的模型与方法中,可准确建模整个CPS逻辑结构、功能流程以及组件之间交互行为的较少,并且多数无法同
近年来含硼无机化合物材料备受关注,其中碳化硼(Boron carbide,B_4C)因其优秀的物化性能在磨具、高性能陶瓷、防弹材料、核反应堆中子吸收材料等领域得到广泛应用;氮化硼纳米管(Boron nitride nanotubes,BNNTs)是一种结构与碳纳米管类似但性能更优于碳纳米管的新型纳米材料。但是目前国内外的生产制备技术严重制约了科学界对B_4C和BNNTs的应用研究。在本实验室现有的
煤气化过程中会产生大量气化废渣,但利用率极低。大多直接填埋,不仅浪费土地资源,还污染水源和大气。本研究利用TG-MS联用仪测定了气化废渣的残碳量,发现粗渣烧失量较低,可以直接利用,而细渣含碳量高,着火特性差,资源化利用难度大。掺烧燃料煤是解决低挥发分气化细渣着火难、燃尽差的一种有效方法。利用热重对气化细渣单独燃烧及与动力原料煤混合燃烧特性进行研究,考察了掺混比例对混燃的影响,分析了混燃过程中的交互
黄金类投资产品的不断发展革新及当今政治经济的不确定性因素增加使得黄金越来越成为一种主流的投资工具,经济贸易的飞速发展及全球化使得黄金市场的深度及广度不断拓展,与其他市场间的联动性增强,黄金价格驱动因素也日渐复杂。2020年在接踵而至的风险事件下拉开序幕,新冠疫情不断蔓延所导致的大范围停工停产使得市场活力下降,市场不确定性增加叠加地缘政治风险,导致油价暴跌、股市熔断,对经济发展前景的担忧使得市场陷入
内补片胶接技术是一种修复纤维增强复合材料(fiber reinforcedplastic,FRP)制件缺陷、损伤的常用方法。其中,高质高效地加工出内凹式结构是可靠修复的关键。目前,工程中仍主要采用砂轮机或砂纸手工逐层打磨的方式加工内凹式结构,加工效率低、质量稳定性差问题突出。课题面向某型飞机复材机翼的高质高效修复需求,提出设计一种修复过程中内凹式结构在位加工的机床,该机床可直接放置在复材机翼上,对
随着汽车的大量普及与汽车电子技术的飞速发展,智能车辆成为车辆领域重要的发展方向,智能车辆对提高驾驶安全性、舒适性等具有重要意义。环境感知技术是智能驾驶技术体系的重要组成部分,其是车辆进行运动避障、路径规划、行为决策、运动控制的基础和前提。在众多环境感知技术中,车载双目系统因具有信息采集范围大、精度高、实时性强等优点,成为环境感知过程中最重要的传感器。车载双目系统进行障碍物检测需要同时具备“双目相机
图像分割的主要任务是将图像中各自具有独特属性的目标和背景进行划分。在计算机视觉领域,图像分割技术一直作为对图像的先导操作而发挥着重要的作用。图像处理程序一般通过图像分割来定位目标区域,减少冗余数据的干扰,进一步对目标区域进行精准操作,从而准确地识别出目标物。基于活动轮廓模型的图像分割方法是一种灵活有效的图像分割方法,由于其方法本身易与交叉领域相结合而受到众多领域专家和学者的关注,产生了多种多样的基
近年来,随着移动互联网的发展和智能化移动终端的普及,各行各业新颖吸睛的应用程序铺天盖地地发展,以视频业务为主导的移动数据流量呈爆炸式增长。为了满足用户对高清视频的低时延需求,具有缓存能力和计算能力的移动边缘计算(Mobile Edge Computing,MEC)应运而生,它通过在移动用户附近部署高性能MEC服务器,来增强移动网络边缘的计算能力,进而降低用户请求被响应的时间。因此,在MEC网络中,
PLZT透明电光陶瓷具有优异的电光性能,但较大的铁电滞后效应增加了电控光学器件的设计难度,由此限制了该材料的进一步应用。为了解决这一问题,本研究以Pb0.91La0.09(Zr0.65Ti0.35)0.9775O3(即PLZT(9/65/35))为基本组分,分别选用Ba2+、Nb5+两种元素对PLZT陶瓷ABO3钙钛矿结构进行A、B位微量掺杂,利用固相反应和通氧热压烧结工艺制备陶瓷材料,探究目标元
目的建立基于替代分析物策略的大鼠胃组织中内源性胍丁胺的液质联用定量检测方法。方法采用d8-胍丁胺为替代分析物制备大鼠胃组织中的标准曲线。大鼠胃组织匀浆经乙腈沉淀蛋