论文部分内容阅读
文本分类在文本信息处理过程中有关键作用,能帮助人们提取有用信息,有效组织文本信息.本文主要介绍了文本分类的背景、国内外的研究现状以及利用机器学习方法解决文本分类问题的一般步骤.文章第二部分对中文分词、特征向量提取、分类器训练和评估原理做了重点介绍,包括了自然语言处理的统计语言模型,机器学习的KNN、SVM、神经网络算法.