论文部分内容阅读
介绍了进行文本分类的关键技术,并着重介绍了常用的文本特征提取方法。选取支持向量机方法作为文本分类器方法,选取不同特征提取方法应用于文本分类,通过实验,比较和分析了由不同的提取方法所构成的分类器的分类性能,确定了信息增益(IG)法和文本证据权(W ET)为两种性能优异的特征提取方法。该结论可为分类性能进一步的优化研究奠定理论和实践基础。