论文部分内容阅读
社会关系网络逐渐成为跨学科研究热点,如何获得类型丰富且准确的人物关系对社会关系网络的研究具有重要的意义,而人物的家庭关系是社会关系网络的基础。本文着重研究了基于信息抽取技术的人物关系网络构建方法,主要研究内容包括:1.实现了一个面向互联网开放环境下的人物家庭关系抽取原型系统。给定少量的种子实例,采用自举学习的方法,从大规模网络资源中抽取人物家庭关系,为下一步构建人物关系网络提供基础;2.研究了面向本地语料库资源的人物关系网络构建问题。首先利用自举学习方法进行人物关系抽取,然后在此基础上通过重名消岐和多名聚合等跨文本指代消解技术构建一个初步的人物关系网络,为进一步的研究指明方向;3.提出一种基于单文本指代消解技术的人物关系网络构建方法。通过模式扩充和基于中心理论的单文本指代消解技术进行人物关系抽取,进而进行人物关系网络的融合。同时还提出了一种基于人物虚拟边的网络评估指标GROVE,用于更合理地评价人物关系网络的性能。在Gigaword语料上的实验结果表明,基于自举学习的人物关系抽取方法和基于跨文本指代消解的网络融合方法,能有效地进行人物关系网络的构建。同时,基于中心理论的单文本指代消解技术可以显著扩展从语料库中抽取的人物关系规模,进而构建出更加丰富可靠的人物关系网络。