论文部分内容阅读
分词就是将连续的文字序列按照特定的规范重新组合成词语序列的过程,在藏文信息处理领域分词是不可或缺的基础性工作,也成为智能化藏文信息处理的关键所在。汉语信息处理中自动分词的基本问题同样存在于藏文信息处理之中,诸如分词规范、歧义切分和未登录词识别三个方面,此外,藏文信息处理的自动分词中还存在对紧缩词识别的问题。