论文部分内容阅读
近年来,支持向量机(SVM)的理论已经取得重大进展,其算法实现策略以及实际应用也发展迅速。可以确信,该技术的研究已发展成为机器学习中一个独立的子领域,在理论和实践两方面都有着光明的前景。SVM的理论体系涵盖的对象极为广泛,包括对偶表示、特征空间、学习理论、优化理论和算法等。标准支持向量机的求解属于二次规划问题。通常情况下,我们实际上假定了问题所给定的数据是精确的,而忽略了数据扰动对于问题解的存在性和最优性的影响。当数据带有扰动时我们仍然用通常的优化模型来处理,产生的最优解很可能违反关键的约束且是从目标函数值来讲的劣解。因此,本文以标准支持向量分类机为基础,对目前较流行的支持向量机算法的特点(包括C-支持向量机、V-支持向量机、限定C-支持向量机、限定-V支持向量机)现有的支持向量机的各种变形形式进行了讨论。以限定v支持向量机为基础,分别从无监督和半监督两个方面,针对数据带有对称多面体扰动的问题,利用半定规划将扰动后的矩阵变量进行变换,通过矩阵变换将因扰动而产生的NP-难问题转化为一般的二次规划问题,并讨论了半定松弛后的解与原NP-难问题解的近似程度。在此基础上,给出数据在对称多面体内扰动的无监督和半监督支持向量机算法。通过数据试验,以限定v-支持向量机为例对该算法的可行性进行了验证,对参数v进行了初步研究并进行了优化选择。理论推导和实验结果都显示了该算法对于存在扰动的数据具有较好的分类效果和分类稳定性。