论文部分内容阅读
支持向量机(support vector machine,SVM)是基于统计学习理论的专门研究有限样本分类和预测新机器学习方法。它拥有完备的数学理论基础,根据结构风险最小化原则在保证学习精度的前提下提高了泛化能力,现已成为机器学习和人工智能界的一个研究热点。但在某些方面,支持向量机仍存在着一些问题,如模型选择、多类分类和大样本数据信息的处理。本文分析了支持向量机算法的理论知识,阐述了不同算法的训练迭代过程,并根据测试条件来建立模型。通过对当前支持向量机算法所存在缺陷的正确定位,从分类回归的目标出发,分别在样本数据的约简、知识提取和算法的复杂度方面提出了相应的改进方法,并通过多次仿真实验证明了所提出算法模型在处理大样本数据信息的能力。主要工作分为以下三个方面:(1)系统分析了支持向量机的理论基础及其训练问题的数学描述。阐述了SVM训练问题最终归结为解一个带有约束的凸二次规划问题。概括了SVM的泛化性能,并对当前流行的一些快速训练算法进行了详细的对比分析。(2)详细研究了基于粗糙集的属性约简策略和规则知识的提取,概括了粗糙集不同算法的应用,并提出了一种基于粗糙集的最小二乘支持向量机的算法模型。该算法分别从分类、回归的角度证明算法的性能。通过MATLAB平台下的802.11a收集样本数据,利用最小二乘支持向量建立信道分类和参数回归模型,根据建立的模型来决策信道的选择和参数配置的确定,并仿真证明了该算法模型的有效性。(3)深入研究了SVM中的支持向量数据描述算法(SVDD),提出了基于粗糙集的SVDD分类算法(RS-SVDD),并利用网上的大样本数据集,采用粗糙集和SVDD算法进行数据约简,并对样本集进行训练测试来建立分类模型。通过与原有的SVDD分类算法比较,仿真证明了本文提出的算法模型具有较好分类成功率,并提高了算法的训练速度。