论文部分内容阅读
核学习方法在模式识别领域中被广泛应用。现有的单核学习方法在推广能力、迭代时间和鲁棒性等方面不够理想,多核SVM(Support vector machine,支持向量机)作为单核SVM的延伸与发展,具有更好的推广能力和更好的鲁棒性。在分析了多核SVM理论的基础上,研究了多核SVM的SILP(Semi-Infinite Linear Pr-ogram,半无限线性规划)算法,包括基于CG(Column Generation,列生成)的SILP改进算法和基于CA(Chunking Algorithm,块算法)的SILP改进算法,将其应用于二分类问题和多分类问题的基准数据集中,进一步将其应用于实际分类问题中,包括手写体数字识别问题的USPS(United States Postal Service,美国邮政署)数据集和MNIST(Modified NationalInstitute of Standards and Technology,国家标准与技术研究院重建)数据集以及生物医电问题的ECG(Electrocardiogram,心电图)和EEG(Electroencephalogram,脑电图),以验证两种基于SILP改进算法的有效性。本文主要研究内容包括如下几个方面:(1)在分析了单核SVM理论的基础上,进一步研究了多核SVM以及其基于CG的SILP改进算法和基于CA的SILP改进算法。结合交叉验证法,以两种多核函数为例,将基于多核函数的两种SILP改进算法分别应用于二分类基准数据集和多分类基准数据集的分类问题中,并且将实验结果与其他经典SVM和LS-SVM(Least Squares SupportVector Machines,最小二乘支持向量机)的分类结果进行比较分析。最后以分类精度、ROC(Receiver Operating Characteristic,受试者工作特征)曲线、AUC(Area Under roc Cur-ve,ROC曲线面积值)和运行时间四个分类指标进行各种分类器分类性能的对比分析。实验结果表明,基于CA的SILP改进算法可以得到更高的分类精度和更快的训练速度。(2)以手写体数字识别中的实际分类问题为应用背景,结合两种SILP改进算法分别对手写体数字识别经典数据集USPS以及MNIST进行分类研究。结果表明,基于多核函数的两种SILP改进算法具有良好的分类性能和泛化性能,能够有效的处理实际分类问题中的大尺度多分类问题。(3)针对生物医电领域中的实际分类问题,结合两种SILP改进算法分别对ECG信号识别问题以及EEG信号识别问题进行分类研究。结果表明,基于多核函数的两种SILP改进算法具有良好的分类性能和泛化性能,能够有效的处理实际应用中的分类问题。