论文部分内容阅读
为了提高文本挖掘算法的运行速度,降低占用的内存空间,过滤掉不相关或相关程度低的特征,必须使用特征选择算法来降低特征空间的维数。提出了一种新的文本特征选择方法:多启发式特征选择算法,该算法对特征进行综合考虑,从而更加准确地选取有效的特征。实验结果表明,该算法的降维能力比最好的三种经典特征选择方法"互信息"和"x2统计量"以及文档频更好。