论文部分内容阅读
本文首次提出利用相邻字对信息进行中文文档分类,使中文文档分类摆脱了对词典和切词处理的依赖,实现中文文档分类的领域无关性和时间无关性.分别利用Naive Bayes和kNN分类方法建立了基于相邻字对信息的中文文档分类系统.初步的测试结果表明本文文档分类系统具有和同类文档分类系统相当的性能.