论文部分内容阅读
随着Internet技术的飞速发展,网页上存在着各种各样、类目繁多的信息,因此网页分类技术就显得越来越有意义。使用向量空间模型(VSM)来表示网页文本,提出了一种改进χ2的文本特征选择方法。最后通过支持向量机方法进行分类。实验结果表明,相对于传统的χ2文本分类统计方法,改进后的特征选择方法的分类效果要好于传统的χ2统计方法。