论文部分内容阅读
近年来支持向量机理论取得了长足的发展,并广泛应用到模式识别、回归分析、信号处理、函数估计等诸多领域,但仍有待进一步的研究和改善。
传统的支持向量机当处理重要性或样本数量不均衡的训练集时其性能,分类精度将会显著下降;训练支持向量机可以归结为求解一个二次规划问题,而求解二次规划的算法的计算复杂度和空间复杂度是随着样本数量的增加显著增加,一些经典的求解二次规划的方法对于学习大规模的训练样本往往会失效。针对这些问题,在二分类方面,本文做了三方面的研究工作。第一,支持向量机参数的选择是决定其性能的关键,本文从惩罚参数、核参数的作用和最优性条件给出了支持向量机参数选择的定性分析;第二,本文给出了两种分类惩罚的支持向量机模型,使之能更好的处理不均衡的样本集;第三,本文提出采用有效集法,针对所要求解二次规划的特点,提出了一种基于有效集法的动态存储的支持向量机算法。该算法很大程度上降低了对计算机内存的需求;提高了求解速度,并保证了分类精度,进一步加快了学习的速度。并且用数值实验对上述三方面工作进行了验证。