适合线上资源收集的中文语料自动储存分类技术

来源 :全国第五届计算机语言联合学术会议 | 被引量 : 0次 | 上传用户:puccacat
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随著互联网资源的大量增加,适合收集利用线上资源的中文语料的自动储存分类技术日渐重要。为此该文将提出一以PAT-tree为基础自动中文语料分类技术,PAT-tree提供适合互联网联网环境的工作结构(Working Structure),这个结构考虑中文特性以及语料库的语言模型应用,所发展的分类特征以及语言模型都可以直接利用PAT-Tree索引。
其他文献
从机械结构的角度,对目前国内各种快走丝线切割锥度加工装置的结构特点、精度误差和综合工艺性,进行比较和分析,提出了锥度加工装置的发展趋势。
会议
该文深入分析了线热源探针及测试条件与线热源的解析解及求解边界条件之间的差异,探讨了探针和实验应具备什么样的条件下解析解中的指数积分函数E[*v1*](X)才能代之以对数函数ln