论文部分内容阅读
支持向量机最初于20世纪90年代由Vapnik提出,是一种新的统计学习算法,其学习原则是使结构风险最小化,这使得支持向量机具有很强的泛化能力。近年来,支持向量机在理论研究和算法实现都取得了突破性进展,是数据挖掘中的一项新技术,开始成为克服“维数灾难”和“过学习”等传统困难的有力手段。
本文首先从支持向量机的理论入手,对SVM及其训练问题进行数学描述.SVM训练问题归结为解一个带有线性等式和不等式约束的大规模凸二次规划问题。在分析现有训练算法的基础上重点分析SMO算法,指出了原始SMO算法的缺陷,即核函数计算量太大占用了算法大量时间;子规划问题的第一个优化变量选取过于随机,从而影响整个算法收敛速度,然后针对上面的缺陷分别对原始的SMO算法进行了改进。最后在研究libsvm的基础上实现javasvm,通过仿真实验对比libsvm与javasvm。