论文部分内容阅读
稀疏子空间聚类是一种基于谱聚类的聚类方法,是聚类高维数据的有效途径。高维数据通常分布在低维子空间的并集上,因而在合适的字典下可以稀疏表示,再利用稀疏表示系数构造相似度矩阵,最后用谱聚类得到聚类结果。如何构建合适的相似度矩阵是稀疏子空间聚类的关键一步,本文针对基于贪婪算法的稀疏子空间聚类,主要工作如下: (1)引入了子空间追踪算法构造相似度矩阵,给出了基于子空间追踪算法的稀疏子空间聚类理论框架,其次证明了算法在每次迭代时保证特征选择和特征再选择的充分条件。最后用数值实验证明了用子空间追踪算法所选出的原子,相比其他算法选取的原子更具代表性,提高了精确特征选择率,聚类误差也得到了保留甚至更低。 (2)分析了高维数据经子空间追踪算法每次迭代所得稀疏解与其最优稀疏解之间的误差,论证了子空间追踪算法所得稀疏解的准确性。 (3)给出了基于广义正交匹配追踪的稀疏子空间聚类理论框架。数值实验表明,与其他贪婪算法相比,其在保证了聚类误差的基础上,运行时间有了大幅缩减。