论文部分内容阅读
事件关系检测是一项深入判定两两事件之间相关性以及具有何种逻辑关系的自然语言处理技术。其核心任务是以事件为基本语义单元,通过分析事件之间的语义关联特征,实现事件逻辑关系的识别与判定,主要包括事件关系识别(即识别有无关系)和事件关系判定(即判定逻辑关系类型)两个研究任务。本文针对事件关系判定任务展开研究与讨论,主要内容可归纳为以下三个方面。1)基于Tri-Training的事件关系分类方法:针对事件关系分类任务中训练语料不足的问题,本文提出了一种基于Tri-Training的事件关系分类方法。该方法首先根据已标注的数据集训练三个不同的分类器,在协同训练过程中,用来扩充各分类器的新标记事件对均由其余两个分类器协作提供,即若两个分类器对同一个未标注事件对的关系预测结果一致,那么该事件对则被认为具有较高的分类置信度,并在标注后放入第三个分类器的已标注集中。最后用训练完备的分类器通过投票表决的方法对待测事件对进行关系判定。2)基于浅层卷积神经网络的事件关系分类方法:通过协同训练的方法一定程度上解决了训练语料不足的问题,达到提高事件关系分类性能的目的。然而该方法过于依赖分类算法和扩充语料,未能剖析事件之间的内在联系。针对该问题,本文提出了一种基于浅层卷积神经网络的事件关系分类方法。通过抽取并融合“事件级”和“跨事件级”卷积特征,充分刻画事件以及事件对的语义信息,并在此基础上构建面向事件关系分类任务的浅层神经网络。该方法既避免了过拟合问题,同时也提升了事件关系分类性能。3)基于图片场景关系库的事件关系分类方法:本文最后提出一种基于图片场景推理的事件关系判定方法。该方法首先在挖掘到的文档库上,根据预定义的关系模板抽取满足条件的事件对。同时,爬取维基百科图片,组成图片场景所需的图片库。在此基础上,通过探索事件文本与图片以及图片对之间的关系线索,进而构建图片场景关系知识库,并借此辅助事件关系推理与预测。实验结果表明,该方法能够有效提升事件关系判定的实验性能。