论文部分内容阅读
为了使聚类可以在低维数据空间中进行,提出了一种新的聚类特征选择方法.该方法分3个步骤,每个步骤都在一个wrapper框架中执行.首先,将所有原始特征都按照重要性进行排序,引入一个特征重要性评价函数E(f);然后,顺序地选择特征组成重要特征子集;最后,去除重要特征子集中可能存在的冗余特征.由于是顺序选择特征而不是在巨大的特征子集空间中进行搜索,因此算法效率很高.实验结果表明该方法可以找出有助于聚类的重要特征子集,并且可以去掉那些不利于聚类的特征.