论文部分内容阅读
特征选择是文本分类的一个核心研究课题.首先提出了优化的文档频和类内集中度,紧接着提出了自适应量子粒子群优化算法并用于训练RBF网络的基函数中心和宽度,而且还结合最小二乘法计算网络权值,对RBF神经网络进行了优化,最后提出了一个综合性特征选择方法.该综合性方法首先使用类内集中度过滤掉一些词条以降低文本特征空间的稀疏性,然后再利用优化的RBF网络对特征进行优选.实验结果表明此种特征选择方法有较好的准确率和召回率.