论文部分内容阅读
最小最大模块化支持向量机(M3-SVM)是对大规模数据进行模式分类的有效方法.为了进一步提高M3-SVM算法处理大规模数据的效率.基于MapReduce的编程模型实现了M3-SVM的并行化.并行化主要分为两个部分:1)将M3-SVM中的多个任务分解进行并行化;2)将M3-SVM中用来训练基分类器SVM的序列最小优化算法(SMO)进行并行化.在多个现实数据集上的实验结果表明基于MapReduce的并行化最小最大模块化支持向量机算法不仅具有较好的可靠性,而且比传统的最小最大模块化支持向量机算法具有更好的时间效率.