【摘 要】
:
从互联网海量资讯文本中挖掘并筛选出感兴趣的实体和事件是当前自然语言处理领域的重要研究方向,也是工业界构建知识图谱的重要环节。以往事件抽取以事件为中心,探究事件类型及事件要素的识别,相关研究工作大多先检测事件再依据事件模式抽取事件论元,模型方法受限于事件检测性能。来源于真实工业场景对于目标实体及其事件信息的抽取需求,本文从实体角度出发,提出目标依赖的事件抽取任务,包含目标依赖的事件检测并扩展到事件抽
论文部分内容阅读
从互联网海量资讯文本中挖掘并筛选出感兴趣的实体和事件是当前自然语言处理领域的重要研究方向,也是工业界构建知识图谱的重要环节。以往事件抽取以事件为中心,探究事件类型及事件要素的识别,相关研究工作大多先检测事件再依据事件模式抽取事件论元,模型方法受限于事件检测性能。来源于真实工业场景对于目标实体及其事件信息的抽取需求,本文从实体角度出发,提出目标依赖的事件抽取任务,包含目标依赖的事件检测并扩展到事件抽取,旨在抽取文本中的实体以及对应的事件类型或事件论元角色信息。本文第一个研究工作聚焦于目标依赖的事件检测,抽取文本中实体并识别目标实体所对应的细粒度事件类型。为了缓解细粒度事件标签多和实体、事件张冠李戴的问题,本文提出目标依赖的语义和句法感知模型,在抽取实体的基础上,融合扩展的事件触发词和实体局部上下文特征来进行实体级事件检测。本文在构建好的真实金融领域事件检测数据集上的实验结果表明模型可以捕捉到实体相关的上下文信息,并能够从多实体、多事件的复杂情况中抽取得到准确、完备的实体-事件对。这一工作发表在2021年IEEE Big Data(CCF-C类)会议。文本语义、句法结构图不仅拉近了词汇间的距离,还蕴含丰富的语义、结构知识,有助于捕捉目标实体相关的事件信息。因此,本文第二个研究工作便是采用图结构表示的方法来实现目标依赖的事件检测,提出文本语义结构图表示增强的目标依赖事件检测模型。依赖于序列、语义、句法依存分析图和边增强的图卷积网络,模型能够进一步提升预训练模型编码能力;集成多种图的实验结果取得了最佳性能,验证了多种图结构可以相互补充,共同辅助目标实体级的事件检测。目前该部分工作已申请相关专利。通常实体在事件中担任着某种角色,为了进一步丰富事件信息,构建完整的知识图谱,本文第三个研究工作将目标依赖的事件检测扩展到目标依赖的事件抽取,以实体为中心,探究实体抽取及对应事件中的角色识别。本文提出序列、文本语义、句法结构图表示增强的事件抽取模型,首先抽取实体、事件触发词,然后预测实体与事件触发词的关系作为实体论元角色。本文在通用事件抽取数据集ACE 2005上进行实验,结果表明模型在实体抽取和事件检测上的性能达到最佳,同时在不依赖额外全局特征的情况下,集成多种图的论元角色抽取也接近当前最优性能,验证了基于语义结构图表示的方法在事件抽取上的有效性。本文研究了目标依赖的事件抽取,分别采用序列编码和图编码方法在本文构建的中文金融数据集和通用数据集上进行了大量实验,结果表明本文模型能够较为准确地挖掘资讯文本中的实体和事件信息,为下游知识图谱构建提供实体和事件要素。
其他文献
近年来,随着深度学习在自然语言处理领域的快速发展,对话系统作为自然语言处理领域的重要应用受到了学术界和工业界的广泛关注。长期以来,研究人员致力于构建能够与人自然对话的智能机器人,而如何赋予机器人表示和应用知识的能力是构建智能机器人的关键挑战之一。目前,基于知识的对话系统通常使用外部知识库、知识图谱或额外的文本信息作为对话系统的知识输入。然而,在实际的应用场景中,外部知识规模庞大、数据类型多样,如何
强化学习以试错的方式,在与环境的交互过程中学习策略。近年来,深度强化学习模型凭借其在游戏中超越人类的性能引起了广泛的关注。虽然深度强化学习模型具有很好的性能,但应用到实际中却存在不容忽视的安全问题。因此,构建可信的深度强化学习系统是非常必要的。本文主要关注深度强化学习的鲁棒性和安全性两个方面,它们都侧重于模型本身的可信程度。在这里鲁棒性关注的是模型对自然噪声的抵抗能力,而安全性则关注的是人为扰动,
本文主要研究了一般线性Lie color代数的Howe对偶.Dongho Moon利用一般线性Lie超代数(?)(m|n)与对称群(?)的Schur对偶以及Lie color代数的表示与Lie超代数的表示之间的联系给出了一般线性Lie color代数(?)(v,ε)与对称群(?)之间的Schur对偶(参见[13]).本文通过“拼接”两个Schur对偶的方法,并利用对称群(?)的Specht模的相关
随着云计算的飞速发展和互联网的日新月异,学术界和工业界的用户都将本地私有的数据外包给云服务器进行存储。然而,数据外包到云端将会带来隐私信息泄露的问题,人们选择将加密后的数据外包到云端,但却阻止了用户搜索存储在云端的加密数据库。动态对称可搜索加密(Dynamic Searchable Symmetric Encryption,DSSE)支持对存储在云服务器上的加密数据进行关键字搜索和更新加密数据库,
自2008年区块链技术诞生以来,工作量证明(Proof-of-Work/Po W)共识算法一直是热点研究方向之一。相关研究表明基于Po W共识算法的区块链协议存在区块间隔时间高方差、矿工独自挖矿收益高方差、越来越趋于中心化和低吞吐量等缺点。近年来提出一系列精美的基于Po W共识算法的区块链协议,用于解决上述缺点。但尚无同时解决区块间隔时间和矿工独自挖矿收益高方差的方案。并且基于Po W共识算法的可
脉冲微分方程及其相关理论在生命科学中有着重要应用.本文利用脉冲微分方程相关理论和方法研究了两类脉冲微分方程模型的动力学性质.一类为周期性脉冲预防接种的COVID-19模型,一类是状态依赖脉冲免疫治疗的肿瘤模型.本文主要内容包含两部分:在第一部分,首先建立了连续性的SQUIR模型,给出了无病平衡点的局部稳定性条件.随后考虑周期性预防接种,建立了周期性脉冲的SQUIR模型,并进一步利用脉冲微分方程的定
本篇论文主要是分析食饵既具有强Allee效应又具有常数捕获的LeslieGower食饵捕食者模型的动力学行为。首先利用定性理论分析了在Allee效应以及常数捕获影响下的平衡点的存在情况以及类型与稳定性,得到了当参数满足不同条件时,系统的平衡点会有多种类型。特别地,在一定参数条件下系统尖点的余维数至少为三,并证明了余维三尖点的存在性。其次,分析不同参数条件下的分支情况。利用分支理论得到随着系统参数的
本文主要研究G=Z2⊕Z2阶化Hom-李代数,主要包括以下两个部分:第一部分首先给出了 gl(V,ε)和osp(V,ε)的color分支的矩阵表示,然后列出gl(V,ε)的一些自同构,并得到了这些自同构的关系式,最后给出了单李color代数sl(V,ε)和osp(V,ε)的自同构的生成元.第二部分证明了有限维单李color代数sl(V,ε)与osp(V,ε)上不存在非平凡的Hom-李color代数
特征值优化在工业界有广泛应用,计算颇具挑战性。本文创新地使用对抗神经网络方法求解一类带有设计约束的第一特征值优化问题。与传统方法相比,其无需求解偏微分方程,不用计算形状梯度,也不依赖于网格,减小了计算消耗的同时又简化了过程,还避免了传统方法容易受到网格影响的问题,只要拥有合适的参数,就能够得到极高的优化效率,训练时间较短。不过该方法缺少一定的数学解释,因此也无法在事先对参数进行估计,需要通过实验才
欧里庇得斯在《俄瑞斯忒斯》中构建了一个全新的复仇故事,紧接着发生于著名的弑母事件之后。诗人在这部新作中花费大量笔墨处理为父报仇所引发的问题,以及这些问题如何进一步导向新的复仇行动。不同于通常悲剧对俄瑞斯忒斯经典故事的解读,这部新剧将人物行动的动因、所遵循的规范从属神层面下降到属人层面,从城邦政治视角考察人们的伦理选择,进而探究复仇的政治意义。在这个过程中,智慧、友谊、神谕、法律、敌我等主要传统伦理