论文部分内容阅读
本文针对VSM(向量空间模型)中KNN(K最近邻算法)在文本处理环境下的不足,根据SOM(自组织映射神经网络)理论、特征选取和模式聚合理论,提出了一种改进的KNN文本分类方法.应用特征选取和模式聚合理论以降低特征空间维数.传统的VSM模型各维相同的权重并不适应于文本处理的环境,本文提出应用SOM神经网络进行VSM模型各维权重的计算.结合两种改进,有效地降低了向量空间的维数,提高了文本分类的精度和速度.