论文部分内容阅读
互联网逐步的渗透在人们的社会生活中,人们试图通过网络扩展交往的范围,寻找自己感兴趣的人并与之取得联系。本文定义了8种人物关系,通过分类的方法实现了自由文本中人物关系的自动抽取.在特征词的选取上,根据抽取对象自身的特点提出了人物主体上下文、人物主体上下文词性、人物分组数与核心特征词四种选择方法,其中核心特征词是结合bootstrapping算法选取的。实验结果表明:分类的方法适合人物关系的抽取,人物分组与核心特征词的选择有利于实验结果的提高。