文档级事件同指消解的研究

来源 :苏州大学 | 被引量 : 0次 | 上传用户:aiming9583o
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
事件同指消解任务旨在判断多个事件实例是否指向现实世界中同一个具体事件,并将指向同一个事件的事件实例链接成同指链。根据事件实例的来源,事件同指消解可分为文档级任务和跨文档任务。本文从中文、英文和跨语言三方面展开文档级事件同指消解任务的研究,主要内容有:(一)基于结构化表示的事件同指消解方法针对事件句表述复杂存在一词多义、多种指代现象,本文提出了基于结构化表示的事件同指消解方法。首先,通过事件五元组构建事件句结构化特征,再编码事件句其他信息及其基础特征;然后挖掘与过滤事件句和事件对之间的关键信息;最后结合事件对特征判断事件实例间是否具有同指关系。与基准模型相比,本文提出的方法在ACE2005中文语料库上性能平均提高了4.68%。(二)基于触发词语义增强的事件同指消解方法针对标注语料库中事件触发词稀疏的问题,本文提出了基于触发词语义增强的事件同指消解方法。首先,引入面向触发词的掩盖策略来预训练基于BERT的编码器,并在大型未标记数据集上对其微调,挖掘目标触发词语义;然后,结合事件语义和交互信息进行事件同指消解。与基准模型相比,本文提出的方法在ACE2005、KBP2016和KBP2017英文语料库上性能分别提升了6.87%、10.745%、7.46%。(三)基于跨语言数据增强的事件同指消解方法针对神经网络难以在小语料库上学习到充足知识的遗憾,本文提出了基于跨语言数据增强的事件同指消解方法。首先,通过翻译生成目标语言文本的方法,扩充目标语言量;然后,利用依存句法分析方法对具体事件实例的相关信息进行识别,通过跨语言预训练模型获取跨语言层面的信息;最后,为避免模型过拟合某种语言的语法,本文采用数据增强策略判别事件实例间是否同指。与基准模型相比,本文提出的方法在ACE2005中英文语料库上性能分别提升了2.52%、0.69%。本文围绕文档内事件同指消解任务展开研究,并针对任务中存在的部分问题提出相应的解决方法,提高任务性能,为事件同指消解的进一步研究提供了参考。
其他文献
知识库是一种计算机系统存储复杂的结构化和非结构化信息的技术。现实生活中大量的知识被存储在结构化的知识库中,如知识图谱和表格数据库。语义解析是一项将自然语言的表述映射为逻辑形式(如SQL查询)的任务。对自然语言问句进行精准、深入的语义解析,是提升知识库问答准确率的有效途径。语义解析技术有两种形式。一种是将自然语言问句与逻辑语句中的信息进行语义匹配,并选择匹配度最高的结果作为答案的抽取式方法。另一种是
学位
在视频中,相邻帧图像的目标之间往往只有极小的位置变化,而现有的视频目标检测方法经常使用逐帧全图像的策略对视频进行特征提取,产生了对大量背景冗余信息的无效计算。并使用LSTM或光流等一些方法来增强目标特征的表达,但是却增加了整体模型的计算开销,无法在一些性能较差的设备上应用。此外,许多方法中还存在相同目标在不同帧中的结果不相关,并且前一帧的检测结果不能在后一帧中起作用、同一目标在不同帧中可能被识别为
学位
背景与目的衰老和慢性疾病均是影响机体体适能水平的重要因素。随年龄增长,老年糖尿病患者更加容易发生肌肉萎缩和体适能水平降低等现象,导致肌少症和衰弱发生率增高,严重影响其生活质量和增加健康不良结局风险。本研究目的在于调查老年住院糖尿病患者肌少症和/或衰弱患病情况,测量其体适能水平,并探讨影响老年糖尿病患者合并肌少症和/或衰弱的相关因素,以提高对老年住院糖尿病并发肌少症和/或衰弱患者体适能水平的了解,为
学位
随着城市治理中数据科学日渐广泛的应用,城市体检作为规划管理领域中的数据化改革正在全国范围内推广。住建部2017年在北京市率先发起城市体检试点,其主要目标是通过监测和管理城市数据来缓解实际的“城市病”问题。但是城市体检作为一项数据治理活动,其既往研究主要关注理论上的体检指标构建和技术创新,却忽视了治理实践方面的思考,部分表现在城市体检缺乏对试点项目数据治理能力的评估和指导,进而限制了其在2020年开
学位
第一部分三叉神经颈髓复合体S1PR1参与慢性偏头痛中枢敏化目的慢性偏头痛(chronic migraine,CM)是指患者连续三个月以上每月头痛至少发作15天,其中偏头痛样发作至少8天。CM治疗反应差、致失能性高,常给个人和社会带来严重的负担。慢性偏头痛病理生理机制的深入研究对于临床工作具有重要意义,其中中枢敏化被认为是慢性偏头痛的主要病理机制。近年来在多种疼痛模型研究中发现,鞘氨醇-1-磷酸受体
学位
目的:探讨我院就诊伴中央-颞区棘波儿童良性癫痫(BECT)患儿出现睡眠中癫痫电持续状态(ESES)现象的危险因素以及BECT合并ESES患儿出现认知功能损伤的危险因素,分析不同诊断标准下的不同治疗方法对BECT合并ESES患儿的有效性及耐药性。对象和方法:选取从2017年11月至2020年10月苏州大学附属儿童医院小儿神经内科门诊和住院部254例诊断为BECT患儿临床资料。(1)根据有无ESES现
学位
目的调查ICU护士留职意愿、自我效能及工作嵌入的现状;分析不同人口社会学因素、自我效能、工作嵌入对ICU护士留职意愿的影响;进一步探讨ICU护士高留职意愿的形成原因,并给出提高留职意愿的初步建议。方法采取横断面调研方式,对常州地区三级医院ICU护士进行问卷调查,量表包括一般资料调查表、护士留职意愿量表、护士自我效能量表、护士工作嵌入量表,调查ICU护士留职意愿、自我效能及工作嵌入的现状。比较不同人
学位
基于图像的物体认知系统蕴含了人类智能中的“示教、学习、识别”基本过程。人脸识别、工业产品的缺陷检测等都可以抽象为物体认知。嵌入式物体认知系统是嵌入式人工智能的重要分支,是人工智能实际应用的主要侧面之一。目前,嵌入式人工智能的发展处于初期阶段,算法轻量化、资源高效利用、硬件构件设计、终端部署方法等技术问题有待深入研究。本文设计开发了一套基于图像处理的嵌入式低资源物体认知系统,对人工智能落地进行了一些
学位
基于分子界面作用的先进气敏功能材料,在生态保护、公共安全和能源开发等领域应用广泛。传统气敏材料的性能研究大多从材料的表象参数定性分析,存在耗时较长、工作量较大以及缺乏预知性等问题。随着微悬臂梁研究的不断深入,气敏材料分析仪利用谐振式微悬臂梁作为生化传感器,变温微称重法为测试理论基础,定量提取气敏材料的特征参数,从热力学与动力学这一特征参数着手,实现气敏材料敏感特性的快速定量评估,在气敏材料性能分析
学位
为了满足长期快速增长的通信容量需求,基于空分复用(Space Division Multiplexing,SDM)技术的多芯光纤(Multi-core Fiber)开始被广泛研究。然而,相比于传统单芯光纤,多芯光纤中独有的芯间串扰(Inter-core Crosstalk)在多芯光纤传输系统中会严重影响光信号的传输质量、降低信道通信容量,成为限制空分复用性能的重要影响因素。在实际多芯光纤中,由于弯
学位