论文部分内容阅读
提出一种基于改进的分类模型的文本分类系统来实现文本的自动分类。针对传统的特征提取算法不能很好区分特征词在类内和类间分布情况的缺陷,该系统利用方差对该算法作了改进,用改进的特征提取算法量化各个特征词的权重,为了降低特征向量的维数,采用为每个类建分类器的分类模型,利用遗传算法来修正各个类特征词的权重,直到为每个类训练出能够代表本类的特征向量,最后用这些类的特征向量进行分类。通过在同一数据集上进行对比实验,说明本文提出的改进分类模型的文本分类系统是正确可行的。