分词规范相关论文
本文认为,要构建高质量的健分词语料库亟需在现有的分词规范中着重补充以下三方面的内容:(1)命名实体(人名、地名、机构名)标注细则......
分词就是将连续的文字序列按照特定的规范重新组合成词语序列的过程,在藏文信息处理领域分词是不可或缺的基础性工作,也成为智能化藏......
本文认为,为提高语料库的分词标注质量应在分词规范中补充三个内容:①命名实体(人名、地名、机构名)标注细则;②表义字串(日期、时间、百......
随着《汉语拼音方案》应用范围的日益扩大,理论语言学,中文信息处理等领域迫切要求目前的汉语分词规范基本达成一致,应该重新整合目前......
自动分词是彝丈信息处理领域的一项基础性课题.词类的划分标准是正确切分词乃至以后的词性标注、文字识别、文本校对、机器翻译、篇......
根据中古汉语的基本特点,结合现有语料库的建设经验,阐述中古汉语语料库选取语料的若干原则:语料样本的代表性、文本类型的平衡性、语......