【摘 要】
:
随着逐渐步入人工智能时代,信息源越发丰富,信息传递速率更高效,互联网中时时刻刻在产生新信息。如何从互联网海量信息中准确快速地挖掘目标信息越来越受到关注。针对文本的信息挖掘,自然语言处理领域定义了信息抽取、事件抽取等任务。其中,事件抽取从非结构化文本中抽取出结构化事件信息,这是构建事件图谱以及其他高级应用的基础。本文主要面向事件抽取的两个子任务进行,即事件触发词检测识别和事件论元角色抽取任务。事件触
论文部分内容阅读
随着逐渐步入人工智能时代,信息源越发丰富,信息传递速率更高效,互联网中时时刻刻在产生新信息。如何从互联网海量信息中准确快速地挖掘目标信息越来越受到关注。针对文本的信息挖掘,自然语言处理领域定义了信息抽取、事件抽取等任务。其中,事件抽取从非结构化文本中抽取出结构化事件信息,这是构建事件图谱以及其他高级应用的基础。本文主要面向事件抽取的两个子任务进行,即事件触发词检测识别和事件论元角色抽取任务。事件触发词检测识别任务从一个句子中检测事件是否包含事件触发词并识别检测到的事件触发词所触发事件类型。事件论元角色抽取任务从事件句中抽取出事件论元并确定他们在事件中的角色。针对当前事件触发词检测识别以及事件论元角色抽取任务中存在的问题进行深入探索,在事件抽取领域已有相关模型方法的基础上,着重研究事件信息之间的内在联系以及不同类型事件与各类实体论元之间的关系。主要内容如下:针对事件触发词检测识别任务,现有方法主要通过提取候选触发词及其近邻词的词汇级特征,但是忽略了事件之间的关系,尤其针对多义词作为触发词时缺乏信息表示能力,导致事件识别存在误差。本文提出了利用双向递归神经网络将句子全局信息融入候选触发词编码中,通过注意力机制挖掘事件间联系,将上下文中的事件信息应用至事件触发词检测识别中。通过实验验证了模型对解决存在一词多义触发词的事件抽取问题的有效性。对于事件论元角色抽取任务,目前的方法将触发词特征编码与候选论元特征编码组合后进行分类,忽略了事件类型与论元实体类型之间的联系。在包含多个事件的句子中一个实体可能在多个事件中承担不同角色,多个实体也可能在同一个事件中承担同一个角色。针对多事件句的论元角色抽取,本文提出基于语义依存分析和多头监督注意力机制的事件论元角色抽取结构。将句子通过双向递归神经网络编码提取全局信息,通过多头监督注意力机制提取事件类型与实体类型关系特征,并辅之触发词和候选论元之间的语义依存路径构造事件论元角色抽取结构进行分类。最终实验结果表明该方法提升了事件论元角色抽取的准确率等性能。
其他文献
雷达目标分类识别是雷达信息处理领域的重要研究方向,无论是在军事领域还是民用领域都具有广泛的需求。现有基于雷达目标回波特征提取的分类识别方法多采用人工提取单一维度特征或融合特征,主要依靠主观因素且并未利用目标回波的全部信息,在复杂杂波环境下及低信噪比条件下识别率低,难以满足用户需求。此外,另一类基于雷达成像的分类识别方法存在原始目标部分信息损失、流程复杂,且对雷达装备有特殊要求、成本高不利于实现的不
目的:对设计合成的一系列灯盏乙素甲酯-4’-二肽衍生物进行生物活性研究,以探索以上衍生物是否具有较灯盏乙素(Scu)更好的抗氧化活性和新生大鼠缺氧缺血性脑病损伤保护作用,为S
扭杆弹簧作为一种性能优良的弹性元件被广泛地运用在各种车辆悬架系统中。车辆在行驶过程中,扭杆弹簧通过弹性扭转吸收和释放能量,到达缓冲和减震的目的。工作中扭杆弹簧经常
电力行业是我国国民经济发展的重要基础,对促进我国经济发展、社会稳定起着十分重要的作用。特别是以燃煤发电形式的传统火电,在之前很长一段时期占据不可替代的地位。但随着我国工业化进程加快,能源需求日益增长,由此带来的生态环境压力日益突出,能源绿色转型迫在眉睫。2015年12月12日,包括我国在内的众多国家在巴黎气候变化大会上通过、并正式签订了“气候变化协定”,后被称作《巴黎协定》。根据协定约定,2030
幼儿园种植区是一个微型的自然生态系统。关注幼儿园种植区,从幼儿阶段起建构人与自然的和谐关系,乃是对2020年新冠疫情引发思考的积极回应。幼儿园种植区活动是幼儿园课程的重要组成部分,研究幼儿园种植区活动的改进方式是提升幼儿园课程质量的有益尝试。基于―种植区活动‖和―幼儿园项目活动‖两条线索的文献分析表明,种植区活动与项目活动具有内在关联。首先,项目活动与种植区活动的内部要素具有一致性;其次,项目活动
研究背景尿液是一种容易获得、具有无创性取样的临床体液样本。基于质谱的蛋白质组学研究表明,尿液中含有数千种蛋白质,是各种疾病的生物标志物的潜在来源。但是,尿液中除蛋白外,还存在着大量的化合物干扰尿蛋白的质谱分析,故而,尿蛋白的提取是进行尿蛋白质组分析必不可少的一步。因此,探究丙酮沉淀后离心转速和温度对尿蛋白质组的影响显得尤为重要。此外,正常人尿液蛋白质组的个体差异与尿蛋白质组在人群中的稳定性有关,这
国务院办公厅印发的《关于新时代推进普通高中育人方式改革的指导意见》和《普通高中语文课程标准(2017年版)》都提出教育教学要促进学生全面有个性的发展。分层教学是较好地将大班教学和个别指导相结合的教学模式之一,将分层教学模式运用到高中作文教学中,既能提高学生的写作能力又能满足时代对个人写作能力的高要求。截止目前为止,将分层教学运用到高中阶段的研究并不多,取得研究成果的更是屈指可数,因此,开展分层教学
随着电子设备的高度集成化,电磁兼容(EMC)成为电子设备稳定高效工作的必要条件,而其中电磁波吸收材料的研究已成为EMC的一个重要分支。蜂窝材料因为其独特的空心结构,具有重量轻、比强度和比刚度高、绝热和减震效果好等优良性能,可应用到承力件。给其加入吸波涂层并经过优化设计,则具备了优异的吸波性能,因此蜂窝吸波材料的研究受到越来越多研究者关注。蜂窝吸波材料要想达到很好的吸波效果,其电磁参数的研究是十分重
随着促生长用途的抗生素的使用进一步受到限制,开发新型的抗生素替代型促畜禽生长剂显得尤为重要。中药具有成本低、环境友好、不易产生耐药性等优点,是畜禽促生长剂开发领域值得探索的方向之一。本实验室与企业合作研制的“贞芪颗粒”是一种以中药女贞子和黄芪提取物为主要原料的复方中兽药制剂。前期研究结果表明该复方中兽药制剂具有显著地促进猪生长效果,具有发展成为畜禽促生长中药制剂的潜力。毒性试验研究和药效学研究是新
近几十年来冤假错案的发生,不仅严重侵害了无辜者的人权,还严重影响了公众对司法公正的信任度。有学者曾分析了 1980年之后,造成我国50起刑事冤假错案的原因,其中有47起就是因为“被告人虚假口供”,在整个调查中占94%的比例。此外,关于暴力型犯罪错案的发生原因中74%是虚假供述引起的。因此要防范冤假错案,应该治标治本。虚假供述是导致冤假错案的重要因素之一,并且虚假供述的成因复杂,类型多样。为了有效避