论文部分内容阅读
在对大数据中的干扰数据进行快速排除过程中,由于处理高维大规模数据集时存在着计算成本高、耗时长的问题,采用传统算法进行干扰数据排除处理时效率低。为此提出了一种采用支持向量机算法的大数据中干扰数据快速排除方法。利用SVDD获得含有单类数据的最小球形边界,通过边界对未知样本数据进行分类,并融合于最小闭包球算法,对SVDD分类器进行干扰数据排除的优化求解,通过比较大数据的估计值与实测值之间的残差来排除大数据中的干扰数据。仿真结果证明,采用支持向量机算法的大数据中干扰数据快速排除方法精确性高,排除效率高。