摘要:该文探讨了分类系统中的三种不同特征项提取方法,文档频率(DF)、信息增益(IG)、互信息算法(MI),并提出了一种结合文档频率和互信息的特征提取方法。通过实验证明,该算法在一定程度上能得到较高的分类准确率。 关键词:文本过滤;特征项提取;向量空间模型 中图分类号:TP391文献标识码:A文章编号:1009-3044(2012)11-2593-02 A New Feature Extra
Along with the deepening of the reform and opening-up policy and the entering of the WTO,international exchange of economy and culture has become more and more