【摘 要】
:
事件抽取旨在挖掘自由文本中的事件信息,并以结构化的形式呈现。它主要包含四个子任务:触发词识别、事件类型分类、论元识别与事件角色分类,ACE为其提供权威数据集ACE2005,并将前两个子任务统称为“事件检测”。基于数据集ACE2005,本课题主要围绕句子级英文事件检测展开研究。目前,事件检测F1值均能达到70%以上,然而,仍存在些许问题。下面将阐述相关问题及解决方案。问题一:语句中多个事件间联系较弱
论文部分内容阅读
事件抽取旨在挖掘自由文本中的事件信息,并以结构化的形式呈现。它主要包含四个子任务:触发词识别、事件类型分类、论元识别与事件角色分类,ACE为其提供权威数据集ACE2005,并将前两个子任务统称为“事件检测”。基于数据集ACE2005,本课题主要围绕句子级英文事件检测展开研究。目前,事件检测F1值均能达到70%以上,然而,仍存在些许问题。下面将阐述相关问题及解决方案。问题一:语句中多个事件间联系较弱,模型难以完整地识别出所有事件。针对该问题,本文提出利用成分间依存关系增强语句中多个事件之间的信息共享,并设计一种门控机制动态融合依存与语义表示,相较于基线模型,实验性能具有显著性提升。问题二:ACE中人工标注的事件描述表明每个事件密切相关的内容仅位于某个连续片段内,现有工作尚未考虑。针对该问题,考虑将事件描述加入事件分类模型中,但存在人工标注耗时及昂贵问题。为此,本文提出一种自动抽取事件连续片段的模型,并将预测出的事件连续片段加入至事件分类模型中。该方法首次考虑事件核心内容,并且实验性能提升。问题三:触发词的一词多义现象易误导触发词的事件类型判别,具有触发词歧义性问题。针对该问题,提出利用文档级上下文与命名实体约束词义,借助多任务联合学习实现特征共享。同时,为进一步提升事件检测性能,将基线模型设置为BERT。该方法首次将文档级上下文与命名实体多任务结合,实验性能具有较为显著的提升,有助于解决触发词歧义性问题。本文从多层次信息角度出发,通过融合语句中成分之间的依存关系、事件连续片段和文档级上下文的事件检测方法,解决语句中的多个事件识别不完整,难以关注事件核心内容及触发词歧义性问题。最终,触发词识别和事件类型分类这两个任务上的F1值分别达到80.3%和77.2%。
其他文献
肿瘤相关巨噬细胞(tumor associated macrophages,TAMs)是脑胶质瘤中最常见的间质细胞,且与胶质瘤干细胞所重构的高度抑制性免疫微环境紧密相关,并具有促进肿瘤进展的恶性生物学效应。胶质瘤干细胞能重塑TAMs的代谢表型,并参与调控TAMs的极化以及向利瘤表型转化。阐明TAMs的脂代谢重塑特征、机制及对胶质瘤进展的影响,将有助于精准靶向干预其畸变的脂代谢,以逆转TAMs的利瘤
研究背景:下肢深静脉血栓形成(DVT)是多种原因导致的下肢深静脉血管内血液异常凝结,会阻塞相应血管,导致静脉回流受阻。如治疗不及时,会继发严重的下肢静脉疾病,如下肢静脉曲张、色素沉着、慢性经久不愈的溃疡等。髂静脉狭窄(IVCS)被认为是DVT最常见的继发性危险因素、也是其发生的解剖学基础和血栓复发的重要因素。目前国内外关注的重点包括以下两个方面:第一,就何种程度的狭窄需要进行临床干预业界存在较大的
研究目的:肿瘤传统治疗方法(如手术治疗、放射治疗以及化学药物治疗等)存在术后复发以及术后患者生活质量下降的风险,且磁共振成像因其对比剂在体内循环时间短难以实现对机体的长期监测。因此,研发一种安全、有效的肿瘤诊疗制剂对提高肿瘤治疗效果和长期监测肿瘤发展具有重要意义。近些年研究发现极小尺寸的氧化铁纳米粒具备成为磁共振成像T1对比剂的能力,同时这一类含铁复合材料与临床常用磁共振成像对比剂马根维显(Gd-
<正> 1925年生于河北省宁河县,1950年拜师学习中医,1955年取得中医针灸医师合格证书,1963年毕业于哈尔滨医科大学。现任哈尔滨医科大学附属第一医院针灸科主任、主任医师,黑龙江省针灸学会常务理事兼秘书长,中国康复学会黑龙江分会理事,哈尔滨市针灸研究所研究员,蒙罗维亚中国成龙中医针灸主任(利比里亚)。早年拜师于姬天枢、与士今门下。曾进修于中国中医研究院受教于董德懋、赵尔康、李志明。他善于中
随着移动互联网的飞速发展,我们已经步入了信息爆炸的时代,平台通过互联网提供种类丰富的服务(如购物、视频、新闻等),而多样的服务也带来了“数据过载”的问题。如何从海量的数据中挖掘有效的数据亟待解决,推荐系统应运而生。推荐系统的主要目标是根据用户与物品的交互信息学习用户的兴趣偏好,根据用户的兴趣个性化推荐物品。但推荐系统始终面临着数据稀疏和冷启动问题,通过引入用户和物品的特征能在一定程度上缓解上述问题
光固化快速成型是将紫外光照射到光敏树脂表面,使其连续固化并逐层叠加成实体零件。本文采用8.9寸的2K液晶显示屏(LCD)作为选择性透光设备,可用于小批量制造工业装配件、医疗牙具和动漫手办等。该成型方式的效率与质量难以协调是制约其发展的主要因素,本文通过解构其成型流程,在各环节提出二者的调和策略。主要研究内容如下:(1)使用了大尺寸LCD作为选择性透光设备并将紫外光功率增加到120W。在机械关键部件
目的:探讨日间高碳酸血症对阻塞性睡眠呼吸暂停低通气综合征(OSAHS)患者记忆力和执行功能的影响。方法:前瞻性收集2019年8月至2020年11月因打鼾于苏州大学附属第二医院睡眠中心就诊的患者,纳入符合入排标准的OSAHS患者123例,详细收集所有患者的基本信息、一般临床资料,检测日间清醒状态下经皮二氧化碳分压(PtcCO2),并行记忆力和执行功能评分,以及整夜多导睡眠监测(PSG)。记忆力和执行
车联网中的车辆通过广播基本安全消息(Basic Safety Message,简称BSM)来共享车辆及交通相关信息,从而提高交通效率和安全性。专用短程通信(Dedicated Short Range Communication,简称DSRC)协议限制了BSM只能在控制信道(Control Channel,简称CCH)上传输,进而导致了BSM的传输效率较低,影响交通效率及道路安全性。随着车流密度的不
群智感知具有时空覆盖广、成本低、应用场景普适等突出优势,可以高效地实现众多极具吸引力的新型感知应用。然而,这些通过利用群体智慧来解决复杂问题的群智感知应用受到参与用户的异质性、随机性等因素的影响,导致群智感知系统收集的感知数据质量难以保证。因此,如何选择合适的用户完成感知任务以保证任务的感知质量是群智感知应用中亟待解决的重要问题,通过设计合理的激励机制鼓励更多潜在用户参与群智感知任务被认为是保证平
随着电商平台的兴起,网络上产生了大量产品相关的评价信息,对市场调研以及潜在客户购买意向决策具有重要意义。面对海量的评价信息,如何快速挖掘产品性能关键评价,从而生成与产品性能息息相关的问答数据具有极大的研究价值。因此,本文针对大量产品评价数据,通过问题生成模型,挖掘用户最关心的产品性能相关问题。传统的问题生成主要针对问答任务相关数据,采用端到端的深度学习架构模型。而基于产品评论的问题生成,不仅需要考