论文部分内容阅读
作为一种新的机器学习方法,支持向量机算法建立在严谨的统计学基础上,在模式识别和函数回归方面都有不俗的表现。支持向量机算法从上个世纪90年代初提出到现在短短十多年的时间得到了长足的发展,并继续得到广大研究者的关注和参与。本文在对统计学习理论和支持向量机算法进行简要分析和回顾的基础上,针对支持向量算法的参数选择问题进行了研究与探讨。支持向量算法虽然有统计学习理论作为理论基础,其泛化能力在理论上有界,但理论上误差的界太过宽松,实际应用过程中算法的性能依赖于算法参数的选择。在对算法分析研究的基础上,对支持向量机算法在电站锅炉系统中的应用进行了研究,着重以某电厂300MW机组锅炉再热汽温建模为例进行了分析与讨论。 本文主要包括以下几方面内容: 1.提出了一种等距支持向量分类器(EDSVC)算法。本文从最优分类超平面的几何意义入手,分析了最优超平面的几何意义,提出了一种等距支持向量分类器(EDSVC)算法。EDSVC本质上与支持向量机算法相同,同样具有理论上的一系列性质。在算法构造过程中,最优超平面的构造是基于一系列局部最优超平面,综合一系列边界点对来构造全局最优分类超平面。这些边界点与支持向量算法中的支持向量对应,因此EDSVC也具有SVM的稀疏性。同时,由于最优超平面是通过一系列局部最优分类超平面来实现的,算法具有增量学习的内在本质,适合于在线学习机的构造。 2.采用基于格雷码的遗传算法对支持向量机算法的参数选择问题进行了研究,将遗传算法与支持向量机相结合形成一个GA-SVM算法。在两个性质不同的多类分类数据集上进行了测试,结果表明该方法能够在更大的参数空间内进行有效搜索,与传统的网格式穷尽搜索相比更有优势。 3.提出了基于正交设计方法的支持向量机算法参数选择方法。统计实验设计是工农业以及科学试验中常用的方案设计方法,本文将正交设计的方法与支持向量机算法相结合,对支持向量机算法参数进行优化选择。将支持向量机算法的一次训练作为一个数值试验,采用正交设计方法进行试验方案的设计和试验结果的分析,分析不同参数对算法性能的影响程度,进而得到最终的支持向量学习机。 4.提出了一种支持向量机算法性能的智能多目标分析方法MOPSO-SVM。作为分类器或回归器的支持向量算法,其分类精度和回归准确度固然重要,但作为算法性能的另外一个度量,算法的速度也是实际应用中需要考虑的问