【摘 要】
:
文档实体关系抽取是自然语言处理领域的基本任务之一,文档级的实体关系蕴含于多个句子,相较于句子级的关系抽取具有更复杂的实体交互方式。论文侧重研究文档级的关系抽取,采用路径推理表示实体的复杂交互,提高实体的特征表达能力;同时,针对实际应用场景中关系标签的不平衡性和稀疏性,采用辅助学习的方式引入实体间关系存在性判断,减少无关噪声的干扰。具体工作如下:(1)实体多粒度语义的文档级关系抽取模型:面向复杂关系
论文部分内容阅读
文档实体关系抽取是自然语言处理领域的基本任务之一,文档级的实体关系蕴含于多个句子,相较于句子级的关系抽取具有更复杂的实体交互方式。论文侧重研究文档级的关系抽取,采用路径推理表示实体的复杂交互,提高实体的特征表达能力;同时,针对实际应用场景中关系标签的不平衡性和稀疏性,采用辅助学习的方式引入实体间关系存在性判断,减少无关噪声的干扰。具体工作如下:(1)实体多粒度语义的文档级关系抽取模型:面向复杂关系模式下语义特征表示的多样性改进实体特征表示的单一性问题,提出多粒度语义的关系抽取模型。将先验启发式规则通过图结构注入到样本数据中,通过图卷积网络和注意力机制表达实体的上下文全局语义和目标实体对之间的路径信息,从而建立实体间的复杂交互信息,因此提高文档级关系抽取性能。(2)依赖路径概率增强的关系抽取模型:针对关系标签分布的稀疏性问题,该模型通过引入增强实体间依赖路径概率的辅助任务,最大化有关系实体对之间的路径概率,最小化无关实体对之间的路径概率,提高模型对存在关系的实体对的关注,减小无关实体对对图模型产生的噪声扰动。(3)文档主题融合的层次图网络跨文档关系抽取模型:针对目标实体间关系出现在不同文档的问题,提出文档主题信息融合的层次图神经网络模型。该模型通过构建双层图神经网络,层次化地建模单个文档内的实体上下文信息和跨文档的实体间交互信息,并结合文档的主题信息,使得模型具备初步的跨文档关系抽取能力。本文围绕文档级关系抽取问题,从不同角度提出改进模型,并在相应的文档级关系抽取数据集(Doc RED)上进行实验和分析比较,实验结果表明本文模型能够提高文档级关系抽取的性能,验证所提模型在挖掘实体语义和缓解标签稀疏性问题上的有效性。
其他文献
定位技术是架空导线巡检机器人研究领域的关键技术之一。在巡检作业中,为了准确反馈导线缺陷位置,需要准确获知自身在作业空间的位置。现有架空导线巡检机器人多采用基于卫星定位的绝对定位方法,与基于轮式编码器的接触式定位方法,存在定位精度差、环境适应性不足的缺点,只能用于机器人位置的粗略反馈,不能适应缺陷定位等高精度使用需求。随着机器视觉的发展,基于视觉的定位方法被广泛的应用于移动机器人的室内外定位中,充分
我国峰谷用电量比远高于发达国家平均水平,电力供求矛盾突出,峰值供电量大提高了电力设施建设成本,空调蓄冷技术以其促进电力负荷削峰填谷的作用,成为缓解建筑能源供需矛盾的有效途径。无机盐相变蓄冷储能密度高于水蓄冷,相变温度宽泛可调至高于冰蓄冷,因其相对于传统蓄冷方式的独特优势成为空调蓄冷领域的可选方案之一。为改善无机盐本身存在的过冷、相分离等缺点,提升其热导率,制备了一种复合无机盐相变蓄冷材料,并以其为
对于桥梁损伤做检测的传统健康监测手段,通常需要耗费大量的人力、物力以及时间才能对损伤进行识别定位;与传统的结构健康监测做法相比,利用移动的车辆收集运行过程中的动态响应数据,可以以更快的速度、更少的设备来评估桥梁的健康状况。由于车辆和桥梁是一个耦合系统,因此车辆收集的数据包含有关桥梁的动力反应信息,这些信息可用作充当健康指标。本研究以一座大跨斜拉桥作为研究对象并建立该斜拉桥的有限元基准模型,主要研究
多机器人系统的研究近年来越来越受到科研工作者的关注,相比于结构复杂但是任务执行能力有限的单体机器人,由多个结构功能较为简单的机器人组成的多机器人系统通过成员间的能力互补和行动协同可以完成单个机器人难以完成的任务,并且具有良好的鲁棒性、可扩展性等优点,具有良好的应用前景。尽管近年来的研究使得多机器人系统的自主智能得到了很大提高,但是受制于当前技术水平,当多机器人系统所处环境或执行任务较为复杂时,其仍
预应力混凝土小箱梁桥在现役中小跨度桥梁中占比较大,因环境和人为等因素情况出现不同程度的病害损伤,日益增加车辆荷载进一步加剧病害发展,结构因病害逐渐老化,影响桥梁耐久性甚至安全性,因此在役桥梁极限承载能力研究显得无比重要。本文以一座具有底板混凝土破损、预应力钢绞线和钢筋断裂复杂病害的预应力混凝土连续小箱梁桥为背景,从特殊检测评定、足尺荷载试验和数值分析三个方面进行极限承载能力研究,并基于承载能力结果
流量分类可以检测流量的来源,可用于网络管理和网络安全。近年来加密流量识别领域研究中广泛使用的流统计特征易引发漂移问题,随着时间和地理等因素的改变,分类准确率会明显发生降低。标准web服务的兴起导致服务耦合现象加剧,移动端加密家族应用流量的识别因此会产生分类歧义问题。对于包含标准web服务的移动端家族应用,分类准确率将会严重下降。一些相关研究的结果表明相同的应用分类模型在对普通应用分类效果超过80%