论文部分内容阅读
对于工业过程数据中的离群点,一般采用稳健估计技术处理.针对Fast-MCD算法中初值随机给定,以及当样本数据较大时,人为给定分堆个数的缺点,提出了一种基于模糊聚类的改进稳健估计算法,即采用聚类中心及聚类个数分别作为Fast-MCD算法的初值及分堆个数选择依据,从而提高计算效率,并使样本数据较大时的分堆计算更合理.将本方法用于分析铝酸钠溶液的温度电导建模数据,实现了离群点的辨识,可以消除不规则数据对软测量建模的不合理影响.与Fast-MCD方法相比,它收敛速度快,计算效率高.