论文部分内容阅读
在语言研究中,经常要对语料进行分词和词性标注,使用VC++设计了一个人工分词及词性标注辅助程序.它能够根据预定的规则对标注后的语料进行检验,发现违反规则的情况给予提示,并且还设计了一个小键盘,减轻了标注者记忆词性标记的负担。使用该辅助程序对大量的古代汉语和现代汉语的语料进行标注。结果证明,该辅助程序既能够有效处理GB2312编码的简体汉字语料,也能够处理Unicode编码的繁体汉字语料,有效地提高了人工分词及词性标注的速度和正确率。