论文部分内容阅读
该文介绍了维吾尔语形态分析语料库及其构建过程.从网上搜集了新闻、科技、小说、散文、日常用语和其它等不同领域的语料,采用制定切分规则(带语音变化和不带语音变化)、人工切分、错误分析和校对等过程建立了维吾尔语形态分析语料库.该语料库为50万词次规模,分为词级和句子级两类标注.该文工作不仅对相关维吾尔语语料库的建设具有参考意义,而且为维吾尔语的自然语言处理的研究提供了有益的资源.