论文部分内容阅读
本文研究开放式中文命名实体识别问题。针对传统命名实体识别方法具有训练语料标注困难,自适应能力不强等缺点,研究人员提出了开放式的命名实体识别。但由于汉语的特殊性,使得开放式中文命名实体识别的相关研究很少,效果也不理想。本文提出了一种开放式中文命名实体识别方法,模拟语言习得的过程,从句子结构出发,通过分类器得到含有命名实体的碎片序列,进而从中抽取出命名实体。实验结果表明,该方法可以较好地从不限领域的中文文本中抽取不限类别的命名实体。