面向文本序列的迁移学习研究

来源 :中原工学院 | 被引量 : 0次 | 上传用户:amexiao428
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
现有的基于神经网络的自然语言处理模型依赖于大量目标域内的标记数据进行训练,然而,为低资源目标域收集足够的训练数据通常是昂贵且耗时的。文本序列的迁移学习方法通过将一些在不同但相关的任务或领域的源域中已经获得的知识直接迁移到感兴趣的目标域来提高目标任务的表现,与单任务方法相比具有直接的优势。虽然迁移学习在文本序列的处理上已取得了不错的进展,但是仍面临一些问题,包括不同领域间“迁移什么”和“如何迁移”。“迁移什么”研究的是不同领域之间可以进行迁移的知识是什么,“如何迁移”研究的是找到可迁移的对象后如何将其提取和迁移到目标领域,针对这两个问题,本文从文本序列的知识表示和文本序列的迁移机制展开研究,主要内容有:
  (1)对文本序列知识表示的研究。文本序列的知识表示主要解决不同领域间迁移什么的问题,重点研究可以进行迁移的通用知识表示。对于序列问题而言,可以进行迁移的知识,是不同领域的要素间通用的内在表示,其特征具有一般性。基于此,提出将关系网络(Relational Network , RN )集成到瓦瑟斯坦自动编码器(Wasserstein Autoencoder,WAE)中,用于学习文本序列的潜在表示。在该模型中,隐性知识可以被更多地学习和利用,从而产生结构化的语义表示。在机器翻译和命名实体识别上的大量实验表明,所提模型优于现有的方法。
  (2)对文本序列迁移机制的研究。文本序列的迁移机制主要解决不同领域间通用知识如何进行迁移的问题,研究如何将在源域学得的通用知识迁移到目标域,以促进目标域的学习性能。为了解决这个问题,提出一种在多任务框架基础上对可迁移的共享抽象知识(Shared Abstract Knowledge,SAR)进行显式建模的方法,用于跨领域学习文本表示。在该模型中,从不同领域学习到的共享公共知识表示会被映射到一个公共的瓦瑟斯坦空间,利用瓦瑟斯坦距离来最小化分布距离,提高分布相似性,同时,抽象标签的词嵌入信息也会被显式地利用,用于分离公共信息中的抽象部分,促进对公共抽象知识的学习。实验结果表明,所提方法可以有效地从源域提取公共的抽象信息,在跨域命名实体识别数据集上取得了最优的效果。
  综上,文本序列的知识表示和文本序列的迁移机制很好地解决了不同领域间迁移什么和如何进行迁移的问题。与现有文献相比,显著提升了翻译和实体识别任务的性能,表明了理论方法的可行性和模型的有效性。
其他文献
学位
学位
学位
学位
学位
学位
学位
蛋白质泛素化修饰是重要的蛋白质翻译后修饰之一,在细胞凋亡、转录调控、细胞疾病、DNA修复等基本反应中承担着非常重要的角色。高效而准确的识别泛素化位点对于研究蛋白质泛素化修饰问题具有非常重要的生物意义。传统的基于生物识别方法需要研究人员在大量的蛋白质序列数据中进行生物实验验证,例如CHIP-CHIP分析法和质谱法等,这需要大量的时间和经济成本。而基于计算的识别方法,能够在大规模数据上进行高效而准确的
稀疏解混作为一种重要的高光谱图像混合像元分解方法,通过在大型公共光谱库中搜索目标遥感图像的组成端元特征和其对应丰度来完成解混任务,而融合空间信息的稀疏解混方法已成为目前的重点研究方向。非局部信息作为高光谱图像的重要空间信息可以更为全面地映射出目标图像的空间特性,在高光谱解混领域也逐渐获得了一些关注。但目前的融合空间上下文信息的稀疏解混方法在模型构建上会出现比较复杂的约束项,从而增大求解的难度。对于
人联网(the Internet of People,IoP)是一种以人为中心的新型实时交互式物联网,它的服务理念聚焦于用户的个性化需求,为个人带来了更丰富的交互体验。近年来,IoP系统在医疗监护和健康领域有着较为广泛的研究。由于系统中包含了大量与用户联系紧密的服务,而这些服务中即使存在一些微小的错误,都可能伤害到用户甚至对其造成生命威胁,所以对IoP系统进行可靠性分析十分重要。然而,IoP系统不
学位