【摘 要】
:
随着人类文明的发展和科技的进步,人们了解这个世界的手段越来越多,获取的数据也更加复杂多样,信息的获取、处理等也从单一的形式逐渐变成图片、文本、视频等多模态的数据。传统机器学习一般针对某一类型数据进行建模学习,而当前面对种类繁多的多模态数据,多模态机器学习也应运而生。无论是传统机器学习还是多模态机器学习都离不开对数据的处理,如何有效获得数据中的信息始终是一个重要的研究领域。传统机器学习中的数据表征学
论文部分内容阅读
随着人类文明的发展和科技的进步,人们了解这个世界的手段越来越多,获取的数据也更加复杂多样,信息的获取、处理等也从单一的形式逐渐变成图片、文本、视频等多模态的数据。传统机器学习一般针对某一类型数据进行建模学习,而当前面对种类繁多的多模态数据,多模态机器学习也应运而生。无论是传统机器学习还是多模态机器学习都离不开对数据的处理,如何有效获得数据中的信息始终是一个重要的研究领域。传统机器学习中的数据表征学习一般是从单一模态数据中提取数据特征进行表示,多模态数据表征学习则是对多种不同模态下的数据进行融合,形成多模态数据表征。当前对多模态数据的表征学习研究仍然存在诸多问题。比如,不同模态数据的异构信息中,可能存在一些互补信息,而目前对这些互补信息的获取仍然处于起步阶段;现实生活中的数据往往会有缺失,比如对齐信息的缺失,而目前的多模态表征学习对于这种未标注对齐的数据无法利用;多模态数据表征基于有效的单一模态数据表征,而对结构化离散的属性数据的表征仍然不能充分获取数据的内在信息等。针对目前存在的一系列问题,本文围绕多模态数据的表征学习进行研究。本文主要贡献如下:(1)提出了基于模态内部结构传递的多模态数据表征学习框架(MTLS)。本文将单一模态内的数据结构作为互补信息,通过数据结构相互传递的方式来利用这种互补信息从而提升多模态数据表征的质量。同时,本文设计了松弛的度量学习策略来进行各模态之间数据结构的传递,同时通过无限边界的铰链损失函数加强了单一模态内的聚类结构。进一步地本文利用三元组的双向索引排序损失函数来对不同模态内的数据对象进行对齐,设计了交替的优化策略,来分别对不同模态下的数据对象以及数据结构进行对齐。最后我们将该框架应用到图片和文本模态,通过跨模态检索任务以及图片的聚类任务验证了表征的有效性。(2)提出了有限对齐数据下的图像-文本多模态表征学习模型(AMRL)。本文利用对齐数据的数据模态对齐以及非对齐数据的分布对齐,来提升多模态数据表征的质量。基于多模态数据表征,设计了自增强的模态内数据对齐策略提升单模态下的表征质量。另外,通过交替的数据分布对齐和模态对齐训练,使得得到的多模态数据表征在跨模态检索上有较好的表现。最后,本文构造了少配对样本数据集以及未见配对样本数据集,测试有限对齐数据下的多模态数据表征在跨模态检索任务的效果,同时测试自增强的模态内数据表征在图片模态下自检索任务的效果。(3)提出了基于层次化耦合关系的离散属性数据表征学习模型(CDE++)。本文分析了离散属性数据的层次化耦合关系(关联关系),从不同的层次来捕获这些耦合关系。我们通过基于出现频率和共现概率来捕捉底层的特征值之间的耦合关系,然后设计了一种混合聚类策略,以在较低层次捕获更复杂和异构的特征值聚类。通过不同的聚类粒度来实现从不同的角度和语义上对特征值进行聚类。然后利用自动编码器来学习高层的特征值类之间的耦合关系,并产生低维的特征值表征向量,进而得到数据对象的表征。我们通过有监督以及无监督的学习任务验证了该模型的通用性及有效性。
其他文献
无人飞行器近年来发展势头强劲,从军事战场杀伤利器,到日常百姓拍照摄影,无人机时代的来临,势不可挡。我们是否已经做好拥抱这个时代的准备?可能还没有,当操控无人机的不是百姓,而是恐怖分子时,我们将不知所措。本文关注无人机反制领域,研究基于全球卫星导航系统的无人机导航欺骗关键技术问题。作为反无人机技术之一,导航欺骗是指通过发射虚假的卫星导航信号,使得采用卫星导航作为时空信息来源之一的无人机达成欺骗方,而
类脑计算是一条通过模仿生物神经网络的组织结构和学习机制来实现人工智能(Artificial Intelligence,简称AI)的技术路线。人脑可以仅用~1.2L的体积和~20W的功耗实现我们人类已知的最高级最普适的智能,通过模仿人脑的神经系统,我们有希望实现满足未来社会发展需求的高级智能。脉冲神经网络(Spiking Neural Network,简称SNN)是类脑计算最具代表性的算法,具有基于
在联合信息环境中,军事信息服务为联合作战任务提供信息支持,这一过程即为联合信息服务。联合信息服务依赖于在异质多源数据有效整合基础之上的信息管理和分析技术。图数据广泛的建模能力,可以有效整合多源异质数据,因此,论文提出一种面向图数据建模的信息技术解决方案。论文首先研究了图数据管理中的重要任务–图数据挖掘。图数据中往往具有不确定性,这种不确定性,可以通过边上具有存在概率的不确定图建模。频繁模式挖掘任务
精确的时空信息对航天器轨位保持以及业务开展具有重要作用,是航天器遂行任务的重要基础。虽然测定轨方法众多,但各有优缺点,并不能完全解决航天器高精度轨道确定的问题。传统的地面定轨再将轨道上注给卫星的模式存在通信压力大、信息滞后的问题,不能满足航天应用日益增加的实时性需求。随着北斗三号系统全面建成,基于北斗星间链路的测定轨成为用户航天器进行自主定轨的一种可行方案。北斗星间链路采用并发空分时分双工星间链路
伴随着应用复杂性以及其所需处理数据量的不断增加,从工业界到学术界,越来越多的用户开始选择将应用部署在数据中心中来满足相关的资源需求。而作为数据中心的重要组成部分,互联网络很大程度上决定了数据中心工作效率的高低与用户程序性能的优劣。与此同时,网络领域也迎来了两种重要的新技术,软件定义网络(Software-Defined Networking,SDN)以及可编程硬件。SDN网络大大减轻了管理员日常网
随着近年来机器人技术的高速发展,地面无人平台在灾难救援、警戒巡逻以及后勤运输等领域的应用更加广泛。相对于有人车辆,地面无人平台可以在更加复杂的环境下行驶。轮式地面无人平台具有行驶效率高、速度快、转向灵活等优点,成为近年来各国地面无人平台的发展重点。但轮式地面无人平台在越野环境下,存在越障能力不足、软路面牵引性能差等机动性问题。围绕提升轮式无人平台的机动性,各研究机构试图通过构型创新来解决这些问题,
电子信息设备不可避免地产生无意电磁辐射,这些电磁波中含有各种信息,存在着信息泄漏的潜在风险。随着信息化发展,电子信息设备的电磁信息泄漏安全问题也日益突出。开展信息设备的电磁信息泄漏检测研究,不仅可以有效发现设备的信息泄漏问题,还可以指导设备的信息泄漏防护,对于保障信息安全具有重要意义。本文重点开展了深度学习方法在电磁信息安全领域的应用研究。针对低信噪比下的电磁信息泄漏特征提取、电磁信号的多重信息泄
吸气式高超声速飞行器极具战略意义和经济价值,其关键技术之一在于机体/进气道一体化设计。通过建立内外流一体化轴对称基准流场,全乘波设计方法[1]能够完成乘波构型的机体/进气道一体化设计,且能让该构型的前体和机体类机翼部件、唇口外机腹部件等仍然保持前缘乘波特性,是一种有很好工程应用前景的乘波设计方法。但该全乘波设计方法只用到了轴导乘波设计,只能设计获得圆弧形唇口进气道,不具备三维水滴形进气道的设计能力
基于阵列传感器的辐射源被动定位在雷达、声纳、通信、电子对抗等领域中均具有重要的应用。相对于窄带辐射源信号,宽带辐射源信号更有利于目标检测、参量估计和目标特征提取,在实际中获得了更广泛的应用。然而,与日趋成熟的窄带辐射源定位技术相比,围绕宽带辐射源的定位研究起步较晚,还需要进一步地发展与完善。当前针对宽带辐射源的定位算法主要基于信号的子空间类方法,且算法大多瞄准远场辐射源的定位,忽视了一些特定应用场
低功耗-无人海洋装备长航程、长续航工作的能源供给是国家深远海战略的重要基础。利用波浪能发电装置吸收、捕获、转换海洋波浪能是为其提供持续、稳定、可靠能源的国家战略需要。众多波浪能发电装置中,基于垂荡运动的波浪能发电装置较适合低功耗-无人海洋装备的供能需求。垂荡式波浪能发电装置研发过程中水面浮体水动力学与能效特性研究是核心和关键工作。本文采用理论分析、数值计算和实验验证的方法,先后对垂荡式波浪能发电装