论文部分内容阅读
涉数的时间语素的词类问题一直是汉语学界争论的一个热点,这些语素在汉语词法自动分析中也是最容易造成混淆和产生不一致的元素。本文从中文信息处理中词法自动分析的角度剖析了涉数时间语素的词类归属,考察了1200万真实语料中涉数时间语素的词性标注和自动分词情况,并提出了改进的分词原则和词性标注原则。