基于度量学习的跨模态人脸检索方法研究

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:lsssml1990
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网中多媒体信息的增长和获取信息便利程度的提高,用户不再满足于传统的信息检索方式,而跨模态人脸检索具有丰富的应用场景,能够满足用户的新需求:比如,用户可以通过人脸图像检索相关影视作品,公安机关可以通过嫌疑人图像检索相关监控视频等。跨模态人脸检索任务的关键问题在于减少模态差异,其模态差异主要包含时空域差异,视角差异和域差异。度量学习是一种减少模态差异的重要技术,已有的基于度量学习的跨模态检索方法用于跨模态人脸检索任务时缺乏对视角差异和域差异的关注,并且在度量学习的过程中存在两个问题:缺乏对全局信息的学习和收敛速度缓慢。根据上述问题,为了实现快速准确的跨模态人脸检索,本文提出了一种基于度量学习的跨模态人脸检索方法。本文主要贡献如下:1)本文提出了一种两阶段的跨模态共同表达生成算法,能够生成在模态内和模态间都具有鲁棒性和可辨别性的图像和视频共同表达。在第一个阶段,改进偏航角等变模块获取对偏航角具有鲁棒性的图像特征,改进多层注意力机制获取具有鲁棒性和可分性的视频特征;在第二个阶段,使用交叉熵损失保持模态内相似性关系,使用度量学习损失保持模态间相似性关系。2)本文改进了跨模态度量学习方法,充分利用每次迭代的三元组信息,采用全局三元组和局部三元组共同训练跨模态共同表达生成网络,提升了度量学习的一致性和准确性,同时通过半困难三元组的筛选加速了损失函数的收敛。3)为了提升跨模态人脸检索方法对域差异的鲁棒性,本文结合了域校准和迁移学习作为域适应方法。本文的域适应方法采用源域图像共同表达的统计信息对目标域图像共同表达的分布进行校准,冻结类中心和视频共同表达生成网络的参数,微调图像共同表达生成网络的参数。最后,在PB、YTC和UMD Faces三个人脸视频数据集中的对比实验和消融实验的结果证明了本文的跨模态共同表达生成算法能够提升跨模态检索的准确率,使用不同数量的样本微调跨模态共同表达生成网络的结果证明了本文的域适应方法提升了目标域图像跨模态检索的准确率。
其他文献
在聚合物加工领域,已有光谱、超声等表征方法对挤出加工中的聚合物进行在线测量表征,但对于无机粒子填充聚合物体系,这些方法受测量原理的影响,测量稳定性较差,于是本文提出了基于机器视觉的聚合物测量方法。本文以玻璃微珠(Glass beads,GB)填充聚丙烯(Polypropylene,PP)材料为研究对象,结合机器视觉与深度学习图像处理算法,实现了玻璃微珠填充聚丙烯挤出加工过程中组分含量的在线测量。本
学位
糖尿病是一种以高血糖为主要特征的慢性病。人体内持续偏高的血糖会引发许多并发症,如糖尿病足、糖尿病肾病、糖尿病视网膜病变等,导致多器官损伤,是严重危害人类健康的重大公共性疾病。目前。临床上最常用的治疗1型糖尿病和晚期2型糖尿病的方法是注射外源性胰岛素。然而,反复的胰岛素注射给患者带来痛苦和不便,注射不当还有可能引发低血糖。因此,寻找一种能模拟天然胰腺中β细胞的实时胰岛素分泌模式的替代策略引起了研究者
学位
近些年通讯行业的发展推动了微电子技术的进步,集成化、小型化、轻量化是目前应用市场对电子产品的新标准。作为典型的无源器件之一的电感,常采用铁基磁粉芯。FeSiCr合金粉末因其优异的饱和磁感应强度、直流偏置性能和环境可靠性在一体成型电感上已得到广泛应用。但由于传统工艺制备的FeSiCr磁粉芯在中高频下会产生高损耗,因而限制了其在中高频下的应用。本文利用硅酸钠对FeSiCr磁粉芯进行绝缘包覆,对FeSi
学位
服务机器人是一种拥有半自主或全自主控制能力的机器人。随着我国老龄化社会和残疾人等服务需求的提高,服务机器人将在我们的生活中扮演越来越重要的角色。自主移动平台技术是开发机器人的基础,针对各个应用领域,设计并实现服务机器人软件系统是开发服务机器人的首要前提。针对各个应用领域的服务机器人的现状以及所面临的通用性及传输协议僵化等难题,本文设计并实现一种通用的面向互联网的服务机器人软件系统。本文主要贡献包含
学位
随着物联网技术的发展与普及,接入至物联网的设备数量不断增加,由于物联网中的设备种类繁多且异构性强,同时很多物联网平台缺乏对设备的统一的语义描述,导致了物联网应用的架构封闭化、碎片化、开发门槛高、开发周期长的现状。针对上述问题,本文提出基于OAA(Object Access Agent)的物联网设备接入方法,其主要内容包括物联网设备描述模型、物联网设备容器与物联网设备接入平台,可作为用于异构设备统一
学位
解耦表征学习对于生成模型的可解释性而言具有重要意义。当前主流解耦表征学习方法依据监督方式的不同,可分为监督解耦表征学习和无监督解耦表征学习。监督解耦表征学习依赖给定监督信息,提取监督信息相关特征,得到的监督无关信息中仍可能存在多种可解释属性;无监督解耦表征学习方法通过对数据先验进行假设,实现数据中的可解释属性自解耦。但由于不存在任何监督信息,模型的每一次训练所解耦的属性在特征向量上的位置以及属性的
学位
本翻译报告是基于对《如何治疗抑郁症》(How to Heal Depression)英译汉翻译实践撰写而成。该书是由哈罗德·H.布卢姆菲尔德(Harold H.Bloomfield)和皮特·麦克威廉姆斯(Peter Mc Williams)合著。抑郁症是现代社会中普遍存在的情感疾病。作者从精神病学和心理学的专业角度出发,带领读者走进抑郁症的世界。该书描述了抑郁症的表现症状、诱因,提出抑郁症的治疗应
学位
SY集团是农林牧渔性质的蚕桑系列国有独资公司,公司并无相关建设项目开发经验和所需要的管理能力及相关人才储备,公司现有开发项目SY产业园,分两期进行建设。SY产业园的建设主要采用传统的承包模式,而第一期项目在实际建设中,由于项目特性以及项目目标的不同,这种模式在SY产业园项目运用上显现出不足及存在诸多问题。因此,我们根据SY产业园项目建设单位情况以及项目本身特性和项目目标要求,在比较国外几种先进项目
学位
将污泥在厌氧或缺氧的条件下高温热解不仅可以大幅度减少污泥的体积,彻底分解有机残余物质和杀死有毒有害的病原体,还可以获得生物炭,应用于重金属吸附。但污泥来源和热解温度等因素会影响生物炭性质、重金属的固定及其吸附。本文选用广州海涛环保公司未水热压滤的市政污泥作为原料,在400-1000℃下通过热解制备污泥生物炭,研究热解温度对其中重金属的固定、环境风险以及生物炭的理化性质影响;最后研究其对Cd(Ⅱ)和
学位
含镍重金属废水不仅含有重金属镍,且含有大量的氨氮、硝酸盐和硫酸盐。传统的重金属废水处理化学药剂用量大,处理成本高且难以达到排放标准。本研究通过硫酸盐还原(SRB)和硫自养反硝化耦合厌氧氨氧化系统分别去除水体中重金属镍和氮,并进行了相应的性能和机理研究。以废水中的重金属镍为目标污染物,通过批次实验探究初始p H、不同有机碳源、C/N比以及铁离子浓度对SRB去除镍影响。研究结果表明,在p H为7的条件
学位