论文部分内容阅读
本文提出了一种基于自举学习的弱指导中文实体关系抽取方法。给定一个小规模的已标注数据集(初始种子集)和一个大规模的未标注数据集,利用从种子集中训练出来的分类器在未标注数据集上产生可靠的实例,再加入到标注数据集中,从而不断扩展标注数据集。在ACE RDC 2005中文基准语料库上的弱指导关系抽取实验表明,该方法能提高抽取性能。