论文部分内容阅读
为了缓和异常值的影响,提高分类器的分类精度,同时降低它的计算复杂性,本文重点研究了三个分类器(基于广义特征值的多平面近似支持向量机(Proximal SVM based on Generalized Eigenvalues,GEPSVM),对支持向量机(Twin Support Vector Machine,TWSVM),孪生有界支持向量机(Twin Bounded Support Vector Machine,TBSVM))模型,在此基础上,对三个分类器进行了改进,旨在进一步提高分类器的泛化能力和鲁棒性。本文主要研究内容如下:1.通过在GEPSVM的目标函数中引入L1范数,提出了基于L1范数距离度量的GEPSVM算法,简称L1-GEPSVM,它可以缓和异常值的影响。本文详细介绍了L1-GEPSVM理论推导,并从理论上分析、证明了改进后的算法可行性及有效性。此外,为了解决L1范数距离的优化问题,提出了一个简单有效的迭代算法,L1-GEPSVM快速收敛,可以得到局部最优解。为了检验L1-GEPSVM的实用性及可行性,在三种数据集(人工,UCI和NDC数据集)上做了大量对比实验,从不同角度对实验结果进行分析,评估L1-GEPSVM算法的分类性能。在UCI数据集上,对实验数据引入了高斯噪声,来比较L1-GEPSVM算法和相关分类算法的抗噪能力。2.为了缓和异常值对TWSVM分类性能的影响,本文把L1范数距离应用到TWSVM中,提出了L1-TWSVM算法,它有全局最优解。本文详细地从理论上对L1-TWSVM算法进行了公式推导,使L1-TWSVM的可行性和有效性在理论上得到了保证。另外,本文把L1-TWSVM与其他相关算法在人工数据集,UCI数据集,NDC数据集上做了详细的实验对比,对实验结果进行了详细地分析,从而验证了L1-TWSVM的实用性。在UCI数据集上,对实验数据引入了高斯噪声,进一步检验了L1-TWSVM的鲁棒性。3.为了缓和异常值对TBSVM的影响,并缩短它的训练时间,本文把L1范数距离和最小二乘的思想引入TBSVM中,提出了基于L1范数距离度量的最小二乘的TBSVM分类算法(L1-LSTBSVM)。本文详细地介绍了L1-LSTBSVM的公式推导过程,并从理论上分析了L1-LSTBSVM的可行性及有效性。把L1-LSTBSVM与相关算法在人工数据集和UCI数据集上做了大量的实验对比。在UCI数据集上,本文分别对实验数据引入10%,20%的高斯噪声,来测试L1-LSTBSVM的抗噪能力,通过对实验结果的详细观察分析,得出L1-LSTBSVM的分类性能较其他分类器有较强的鲁棒性。