论文部分内容阅读
语义分析是对非结构文本进行理解的一种重要手段,对自然语言处理领域中的多项应用具有重要意义。语义角色标注是文本语义分析的重要工具,且作为语义分析中的一种浅层分析技术,一直是自然语言处理领域的研究热点。语义角色标注的主要目标是识别出给定句子中的“谓语-论元”结构,并为所有论元分配在谓语所指事件中担任的语义角色。以往的语义角色标注研究大多基于传统的机器学习算法,这些方法依赖于句法分析的结果,进而选取有效的特征及特征组合。特征工程是一项费时费力的人工经验性任务,且句法分析器的错误分析结果会影响语义角色标注模型的性能。随着深度神经网络的强势崛起,越来越多的研究者开始使用深度神经网络来完成语义角色标注,通过模型自动提取特征来减少对人工构造特征的依赖。虽然现有的许多深度神经网络模型已在语义角色标注上取得不错的成绩,但这些模型仍存在一些问题:一、如何更好地利用词性和语义角色间的语义依赖关系;二、如何有效地将依存树中的依存句法信息加入到语义角色标注任务中;三、忽视了选择性偏好信息能够为语义角色标注提供丰富的语义信息。(1)针对如何更好地利用词性和语义角色间的语义依赖关系的问题,提出了一种将词性和语义角色联合标注的辅助深度神经网络模型。首先,模型使用双向长短时记忆网络来编码句子输入以获取词语上下文表示,且两个标注任务交替训练使得有效特征信息通过硬参数共享的网络结构实现共享;然后,在主要任务-语义角色标注的训练过程中引入了论元识别层,其能够使用谓语来选择与论元相关的重要信息。最后,使用公开数据集Co NLL2005对模型进行训练和参数调整,并将实验结果与现有的多种模型进行对比。实验结果表明,本模型在测试集WSJ上取得了89.0%的F1值,与现有的最好模型相比提高了0.8%,有效地建模了词性和语义角色间的语义依赖关系。(2)针对如何有效地将依存树中的依存句法信息加入到语义角色标注中的问题,提出了一种基于注意力机制的双向图卷积网络模型。首先,模型将词性向量和词向量进行拼接作为双向长短时记忆网络的输入,进而将词性特征加入到词的特征表示中;然后,使用了注意力机制对句子中的谓语-论元间的依赖关系进行选择;最后,将选择后的特征信息及存储句法依赖边的方向矩阵共同输入到双向图卷积网络中进行二次编码,模型的顶层使用了条件随机场来捕获角色标签间的依赖关系。该模型同样使用了Co NLL2005数据集进行训练和预测,与上述的多种模型相比,本模型在WSJ和Brown测试集上分别取得88.9%和79.5%的F1值,优于现有的最好模型,有效地利用了依存树中丰富的依存句法信息,并使用注意力机制强调了谓语在语义角色标注中的重要作用。(3)针对忽视了选择性偏好信息能够为语义角色标注提供丰富语义信息的问题,提出了一种基于谓语-论元选择性偏好的Transformer模型。首先,模型使用多层堆叠的Transformer构成的句子编码器来编码句子输入中的词汇和语义信息;然后,多层集成器构成的选择性偏好编码器将SP-10K数据集中的谓语-主语、谓语-宾语选择性偏好关系信息融入到句子的嵌入表示中;最后,将嵌入表示进行线性处理后输入到Soft Max层中完成角色分类。本模型在测试集WSJ和Brown上分别取得了89.9%和80.4%的F1值,与现有的最好模型结果相比提升了1.7%和1.1%。实验结果表明,本模型使用的Transformer能够在不考虑词与词之间距离的情况下获取词与词间的依赖关系和语义信息,进而标记嵌入中包含更详细的上下文信息;本模型还将选择性偏好信息融入到嵌入表示中,重点关注了谓语-主语、谓语-宾语间的选择倾向性,利用更多的选择性偏好关系来辅助语义角色的标注,进而有效地利用了选择性偏好中丰富的语义信息。基于词性和语义角色联合标注的辅助深度神经网络模型用于更好地利用词性和语义角色间的语义依赖关系,基于注意力机制的双向图卷积网络模型用于更好地使用依存树中的依存句法信息,而基于谓语-论元选择性偏好的Transformer模型用于更好地使用选择性偏好信息中的语义信息,以上三个模型用于弥补现有语义角色标注模型中的不足,分别对应于拥有词性标签、依存句法分析结果或丰富选择性偏好信息的三个应用场景。