论文部分内容阅读
随著互联网资源的大量增加,适合收集利用线上资源的中文语料的自动储存分类技术日渐重要。为此该文将提出一以PAT-tree为基础自动中文语料分类技术,PAT-tree提供适合互联网联网环境的工作结构(Working Structure),这个结构考虑中文特性以及语料库的语言模型应用,所发展的分类特征以及语言模型都可以直接利用PAT-Tree索引。