论文部分内容阅读
文本预处理是文本分类的首要任务,特征加权直接影响文本预处理的质量,本文提出了基于粗糙集和特征位置重要度加权的方法,该方法的主要思想是:在计算传统TF-IDF特征权重的过程中将已有的决策信息和特征的位置信息引入到权重计算中,考虑可变精度粗糙集模型中的近似分类质量和近似分类精度以及特征位置信息对全局分类的作用.经过多重文本分类实验证明,本文提出的特征加权方法能够明显的提高文本分类的效率.