论文部分内容阅读
语料库词性自动标注是语言信息处理中的基础课题。实践表明,造成汉语的词性标注准确率不高、难以实用化的最重要的因素是软件的兼类词鉴别能力差。作者以大规模的真实中文文本中反映的语言事实力依据,采用概率统计和基于规则相结合的混合方法,对汉语的语料进行了标注试验,取得了较为满意的效果。