论文部分内容阅读
槽填充(Slot Filling)任务是TAC(Text Analysis Conference)会议于2009年提出的KBP(Knowledge Base Population)评测任务的主要组成部分。作为问答系统和信息抽取中关系抽取的延续和发展,槽填充任务的主要目的是探究从开放的数据源中抽取特定类型实体属性信息的方法。在目前的槽填充任务中,基于依存路径的模式匹配方法被较多的系统所采用,而其中的依存路径主要以斯坦福大学定义的依存关系为基础构建。本文以基于依存路径的方法为基础,探讨了该类方法中存在的问题并提出了相应的解决方法。本文的主要工作包含以下几个方面:首先,本文研究了针对槽填充任务的不同实现方法,并以KBP提供的评测资源为基础,以斯坦福的自然语言处理工具,WordNet语义词典等为辅助,实现了一个基于模式匹配方法的槽填充基准系统。其次,由于斯坦福的依存关系在槽填充任务中构建依存路径时存在很多的问题,其中比较常见的有冗余程度较高,可靠性差,区分性低等。为解决这些问题,本文对斯坦福的依存关系进行了重定义,并对部分种类的关系进行了删减,细化和转换,最后将这些方法运用到基准系统中,优化系统的性能。最后,针对基准系统中模式的正确率较低的问题,本文充分利用了槽填充任务的本质特点,提出了模式语义定义和基于所有格关系,主谓关系的模式筛选方法,进一步提高了系统的性能,使得系统最终的F1值为24.7%,相对于基准系统的14.4%,提高了10.3%。