基于实体类型嵌入与循环分段残差网络的关系抽取研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:woshizzh1713
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
作为信息抽取的核心任务,有效的关系抽取是信息爆炸时代的一大挑战。本文在进行关系抽取这一基础性研究时发现,现有的模型在应对长而复杂或无直接实体关系触发词的句子时,往往很难有效地抽取其中蕴含的实体对关系。而这种句子在自然语言文本中是普遍存在的,这使得关系抽取的效果遇到了瓶颈。本文深入调研并分析了国内外在关系抽取方面的研究。在融合更多更深层次信息的思路启发下,本文提出实体类型嵌入(Entity Type Embedding,ETE),并将ETE和词嵌入、位置嵌入一起作为模型的联合嵌入层,从而丰富了关系抽取模型的嵌入层表示。此外,还设计了循环分段残差网络(Recurrent Piecewise Residual Networks,RPRN)结构,该结构对深层语境下句子的潜在表示进行了不同级别的抽象,因而在面临各种复杂的大规模语料时,能够更好地学出句子的结构化表示。本文提出的基于ETE与RPRN的关系抽取模型(ETE-RPRN),能有效地提取句子中更深层次的语义信息。为了更好地评估模型,本文进行实验时采用了在关系抽取领域广泛使用的纽约时报公开数据集。然后,将本文提出的ETE-RPRN关系抽取模型与其他学者的模型从各种评估指标上进行了定量比较,并对不同模型抽取出的不同结果进行了定性分析。实验结果显示,本文提出的模型在F1、AUC等指标上胜过现有最新的模型,在应对大规模复杂语料时能提取出更多有效的关系,从而很好的解决了现存模型所遇到的上述问题。同时,抽取的关系事实是构建语义检索、问答系统等上层应用的重要基础。
其他文献
本文以西藏革吉县嘎拉勒矽卡岩型铜金矿床为研究对象,在矿区地质填图(1:2000)基础上,结合前人研究资料,对该矿床地质特征和控矿条件进行了系统阐述,分析探讨了典型镁质矽卡岩的矿物学特征、成矿岩体的地球化学特征和岩石成因,查明了成矿流体性质和来源,厘定了成矿驱动机制,并初步建立了矿床的可能成矿模型。矿区内出露地层厘定为下白垩统捷嘎组白云岩和白云质灰岩,其下伏为下白垩统郎久组砂岩、粉砂岩和流紋质-英安
压缩感知理论带来了一种全新的信号采样方式。当信号本身或在某个变换域具有足够稀疏的表示时,能够以低于奈奎斯特定理要求的采样率对信号进行采样,并对其完美地重建。对于用
蛋白质泛素化是一类典型的翻译后修饰(PTM),它承担着调节生命活动的重要作用,研究发现泛素化影响着细胞凋亡、细胞增殖和信号转导;蛋白质SUMO化是一类与泛素化非常相似的翻译
甲状腺癌是人体内分泌系统中患病率最高的疾病之一,近年来发病率逐年上升。超声检查可以识别触诊较难发现的甲状腺结节可疑病灶,是实现早期甲状腺癌筛查的有效手段。医院超声
电化学发光(Electrochemiluminescence,ECL)也称为电致化学发光,是经由电化学反应诱发的化学发光。在这过程会经历一系列氧化还原反应形成发光激发态,由高能量的激发态返回低能
随着诸如汽车电子、微处理器等应用系统愈发复杂,需要安培级大电流的场合也越来越多。LDO凭借结构简单、成本低、高电源纹波抑制能力以及快速瞬态响应能力等优点,逐渐占据了过去由开关电源把持的15A的应用领域。如今的电源和热管理趋势是尽可能降低电源电压以减小静态功耗,这会导致MCU和DSP等负载电路对电源电压的变化更为敏感。因此,安培级LDO系统设计中的一个重大挑战是在高摆率负载电流转换期间将输出电压的波
近年来,随着深度学习技术的不断发展,越来越多的研究人员、企业员工等希望利用深度学习技术来理解视频内容。其中,基于视频的行为识别任务得到了许多研究者的关注。对视频中
随着深度学习的快速发展,互联网行业愈加贴近人工智能的研究初心。其中,计算机视觉和自然语言处理这两大研究方向,帮助机器模拟人类的视觉和语义理解,使得深度学习在人工智能
在银行系统的管理中,许多应用系统涉及到系统稳定性以及业务安全性的考虑,始终难以将应用系统对接银行单点登录平台。而银行系统运行的特征是7*24小时不间断服务,而无论业务人员或是系统维护人员都可能在任何时点能够登录系统,应用系统与单点登录对接虽然大大方便了用户对于系统的使用,但对于运行的稳定性,多一层系统的应用就会多一层系统运行的风险。银行业务系统的连续性、实时性始终是银行信息系统运行的首要目标。传统
近年来,可见光促进的光化学反应取得了极大的进展。可见光是一种廉价、清洁且相对温和的可再生能源。因此,利用可见光催化来合成复杂分子具有较好的前景。此外,含氮杂环化合