基于图像的多模态预训练语言模型研究

来源 :海南大学 | 被引量 : 0次 | 上传用户:fanjun6699
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语言模型是自然语言处理(NLP)中解决任务的常用模型,利用对自然语言的建模来明确词汇之间的概率关系,从而生成适用于多种NLP任务的词嵌入矩阵。现如今,预训练技术被证明能极大的提升语言模型的性能,经过预训练的模型能显著提升处理任务的能力。现今,大部分计算机视觉(CV)和NLP领域的模型以及视觉-语义联合领域(Vision-Language)的模型都使用了预训练加微调的形式,从而使得模型对不同的任务都能快速收敛。然而,现有的预训练方法存在着以下几个问题:(1)模型只能处理单一场景的问题,或只能处理单模态任务场景,亦或着只能处理多模态任务场景,缺少通用的预训练模型以解决不同场景下的任务。应用于不同场景的模型只能做单一场景的任务,这意味着对于不同场景的任务,需要使用不同的模型,并且需要分别做预训练。然而模型的预训练需要花费大量的计算资源和时间成本。(2)处理单模场景的模型的编码方式存在局限性,现如今常用的预训练方法为:使用单模或多模的数据对模型进行预训练,利用Transformer的自注意力机制对输入文本的每个词通过上下文进行编码。该方法仅使用了语言的统计规律进行编码,缺少了具像化的编码信息。如,如果编码中添加了图像信息,那么拥有相应视觉特征的词汇的编码形式可以是根据像素编码,这不仅有助于区将名词区分出来(有视觉特征的词大多为名词),而且能将拥有相似视觉特征的词汇聚类。这样的编码方式中,在不增加空间成本(即维度)的前提下,每个词将带有更多的特征信息,更有助于处理各类语言任务。基于以上两个问题,本文分别有针对性的实现了以下改进:(1)基于第一个问题,本文设计了一套通用的方法,使用以Transformer为核心的多模态模型通过同时训练多个场景的任务的方式,以达到既能处理单模任务,又能处理多模任务的效果。并且该模型在单模的主流评测集GLUE中多项任务指标高于BERT,在多模态的多个任务中性能与当前一流模型相当,如UNITER、VL-BERT,并且仅预训练一个通用的预训练模型就能应用解决解决不同情景下不同模态的任务。(2)基于第二个问题,本文在常用的上下文编码的基础上,额外使用了图像特征进行编码。输入文本通过多层Transformer的编码器进行编码后,使用掩盖文本预测图像特征的方式,让编码贴近图像特征表达,从而让词汇的编码带有图像特征。该模型在GLUE评测集上多个任务的表现效果优于BERT。
其他文献
水下传感器网络在海洋应用中扮演着日益关键的角色,如应用于深海监控,海洋污染监测,以及深海资源管理等方面。但水下环境复杂多变,在陆地上相对成熟的无线传感器网络技术并不能直接应用于水下网络,因此水下传感器网络面临诸多挑战。路由性能的优化对于水声传感器网络能效的提升有着直接的影响,是水声传感器网络研究的关键课题之一。针对水下传感器网络数据传输效率低、网络生存周期短的问题,本文首先提出了两种适用于浅水区域
学位
互联网高速发展的同时伴随着大量的网络安全问题,恶意软件便是网络空间中存在的巨大威胁之一。日益增长的恶意软件及其变体使得准确和高效地检测恶意软件变得十分困难,现有的方法已经难以完成越来越复杂的恶意软件检测和分类任务。一方面,传统的基于机器学习的方法在进行特征融合时,没有考虑特征之间的关联性,导致表征能力不足,检测精度较低,并且容易受到概念漂移的影响。另一方面,现有的基于图像的恶意软件分类方法,在可视
学位
随着全球数字化进程加快,网络攻击事件层出不穷,网络窃听已成为网络通信安全的严重威胁。功能日臻完善的网络嗅探器和密码破译软件使得隐蔽通信变得愈加困难,现有的隐蔽通信方法面对来势汹汹的网络窃听攻击越来越显得力不从心。一方面,基于网络专线和数据加密的传统隐蔽通信方法容易引起网络攻击者的注意。另一方面,基于数字图像隐写的现有隐蔽通信方法,容易遭受到JPEG等有损压缩攻击而导致数据传输出错。单张数字图像隐写
学位
二维(2D)材料因其卓越的物理性质和在光学、电子学、光电子学以及自旋电子学等领域的潜在应用而受到人们极大的关注。在过去的几十年里,很多研究工作都集中在了石墨烯上。然而石墨烯是一种零带隙半导体,这限制了其在光电子学方面的应用。而过渡金属硫属化物(Transition Metal Dichalcogenides,TMDCs)与石墨烯相似,是一种具有蜂巢结构的二维层状材料,其层内原子的成键属于共价键,层
学位
无线传感器网络在物联网时代下作为获取数据信息的重要技术之一得到了快速发展,应用领域也十分广阔。但是无线传感器网络仍然受到节点能源限制的问题,并且受到恶劣环境等影响会造成传感器节点故障,降低数据传输的可靠性等问题。因此,如何有效降低节点能量损耗,延长网络生命周期是无线传感器网络的关键问题。针对无线传感器网络非均匀分簇存在簇群范围过大,随机选择和更换簇头导致的节点能量资源消耗过快出现死亡,簇群覆盖面积
学位
随着互联网智能设备普及率的不断提高,智能家居、智慧城市和智能电网等物联网相关技术已经融入到人们的日常生活。物联网终端设备和云服务器共同构成物联网,随着物联网行业的持续发展,产生的数据与日俱增。为了对数据进行更加方便的存储和更加有效的利用,在面对海量数据的传输和存储方面,物联网终端设备产生的数据存储在云端的服务器中,大量的信息和基础设施被连接到公共互联网上,这使得数据面临着许多安全威胁和挑战。尤其是
学位
随着各国对海洋重视程度的提高,水下通信技术得到迅速发展,水下传感器网络应运而生。水下传感器网络在海洋应用技术如海洋资源探查、军事监视、灾害防护等方面起着重要的作用。但水下通信环境复杂,存在延时大、带宽低等问题。而水下路由协议决定着节点的通信路径,对水下网络的性能起着关键作用,是当前研究水下传感器网络的热点。本文的主要工作及创新点如下:(1)针对水下路由空洞问题,本文提出一种基于深度的双层级节点分层
学位
近年来,水下无线传感器网络受到越来越多研究人员的关注,因其在国防军事及海洋资源环境监测上展现出巨大的应用价值。然而,由于网络的部署水下部署环境具有开放性和无人值守性,使得传感器节点容易遭受各种各样的攻击。虽然传统的安全技术可以有效应对外部攻击的威胁,但不能应对内部攻击的威胁。信任模型已用于许多应用场景下的恶意节点检测中。然而,复杂、动态和恶劣的部署环境使得现有的信任模型在水下传感器网络的恶意节点检
学位
随着水下智能物联网的发展,水下无线传感器网络的应用越来越广泛。但由于水声信道具有时延高、能量损耗大、吞吐量低等特点,严重制约了水下传感器网络的传输效率。因此,如何从基于通信链路质量的路由层面找到一条最优的数据传输路径,从而实现网络数据传输效率最大化,是当前水下传感器网络的研究热点。本文的主要研究工作和创新点如下:1.针对水下无线传感器网络吞吐量低的问题,提出了一种基于链路质量的水下机会路由算法OR
学位
物联网应用的增加,给人们带来更多智能化服务的同时,也出现了严重的安全问题:实际网络环境越来越复杂,单一的安全防护措施无法适用于所有网络环境。随着物联网应用所涉及的领域增多,所造成的安全事故的损失更加严重,波及的范围更广。区块链由于采用分布式存储,具有透明可信、防篡改和可追溯等特点,为保障物联网安全提供了新思路。然而目前区块链系统在计算、通信和存储上的开销极大,并不适用于大多数物联网中的资源受限设备
学位