一种对任何SVM核通用的支持向量机算法

来源 :电脑知识与技术 | 被引量 : 0次 | 上传用户:wanghuayu1985
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘要:以支持向量机(SVM)和传统统计分类方法为研究对象,详细介绍二者分类方法的基本理论,概述支持向量机的一些常用算法,并在改进共轭梯度迭代PRP-SVM基础上提出一种对任何SVM核通用的正交校正共轭梯度迭代的支撑向量机(CGM-OC-SVM)算法,并通过C语言编程实现了CGM-OC-SVM算法,利用Matlab进行算法模拟。
  关键词:支持向量机;SVM;PRP-SVM;CGM-OC-SVM
  中图分类号:TP391文献标识码:A文章编号:1009-3044(2007)15-30814-02
  A Algorithm of SVM for any Kernel
  TAO Mei, Wushour·Silamu
  (School of Information and Engineering Xinjiang University,Wulumuqi 830046, China)
  Abstract: Taking support vector machines (SVM) and the traditional statistics classification method as the research object, introduces the classification method theory of SVM algorithms,and based on PRP-SVM,then puts forward the orthogonal adjustment conjugate gradient iteration algorithm of support vector machines (CGM-OC-SVM), meanwhile the CGM-OC-SVM algorithm is carried out by the C programming language,and doing a graphic simulation using Matlab.
  Key words: Support vector machine; SVM; PRP-SVM; CGM-OC-SVM
  
  1 引言
  
  数据挖掘中,数据的分类与回归问题是其重要的研究对象。常用于分类和回归的方法,如Bayes 分类、Logistic 回归、神经元网络等在实现机器学习时,都是基于经验风险最小化原则的。然而,一般在有限样本的情况下,经验风险最小不一定意味着期望风险最小,在有些情况下会出现“过学习”和推广性不好等情况,得到的实验结果并不是很理想。
  Vapnik 于上世纪90年代初提出的支持向量机(SVM),是数据挖掘中的一项新技术。它是在统计学习理论的基础上,借助于最优化方法解决机器学习问题的新工具。该算法是一个凸优化问题,即局部最优解就是全局最优解,这是其他学习算法所不及的。SVM 基于结构风险最小化原则,能很好地解决有限数量样本的高维模型构造和“过学习”问题,具有良好的推广性和较好的分类精确性,已被应用于人脸识别、医疗诊断等方面。
  尽管SVM 的应用领域很广,但其理论研究还相对滞后,其中就包括算法本身改进和算法的实际应用。支持向量机分类器最终可以转化为解决一个二次规划问题,目前的研究大都集中于如何在训练数据较多的情况下来解决这个二次规划问题。现基于改进共轭梯度迭代PRP-SVM 算法的基础,提出一种对任何SVM 核通用的正交校正共轭梯度迭代支持向量机算法(CGM-OC-SVM),并通过程序实现此算法,利用Matlab进行算法结果的图形模拟。
  
  2 支持向量机(SVM)
  
  SVM与传统统计学的大样本量研究方向不同,它最大的特点是遵循“结构风险最小化原则”,尽量提高学习机的泛化能力,即由有限的训练样本集获得小的误差的特性,保证对独立的测试集有小的误差,从而解决了有限样本的“过学习”问题(即机器复杂性越高,则置信范围越大,导致真实风险与经验风险可能的差别越大)。目前,该技术已应用到手写体识别、人脸识别、指纹识别、语音识别、数据挖掘等领域。
  SVM的核心理论包括:(1)VC维理论,不仅要使机器学习的经验误差最小,而且应该最小化函数集的VC维,从而控制学习机的结构误差,使SVM分类器具有较强的泛化能力;(2)引入最优超平面概念,使函数的VC维上届达到最小,而最优超平面问题可以转化为二次规划问题;(3)核空间理论,通过非线性映射将输入空间映射到高维特征空间,使低维输入空间线性不可分问题转化为高维特征向量空间线性可分问题,并通过核函数绕过高维空间,使计算在低维输入空间进行,从而不需知道非线性映射的具体形式。
  2.1 线性SVM最优分界面
  2.1.1 线性可分情况
  假定训练数据为 个观测样本(x1,y1),(x2,y2)…(xn,yn),xi∈Rp,yi∈{+1,-1},则存在超平面(w·x)+b=0线性可分,使训练点中的正类输入和负类输入分别位于该超平面的两侧,或者说存在参数对(w,b),使得yi=sgn((w·xi)+b),i=1,…,n这样的超平面通常不止一个,因此,我们的目的是要找到一个最优分类超平面,使分类面经验风险最小(即错分最少),并且推广能力最大(即空白最大)。如图1中(a)、(b)所示:
  图1 2-class分类
  SVM问题的数学表示为:
  2.1.2 线性不可分情况
  2.2 非线性SVM最优分界面
  在很多情况下,数据是线性完全不可分的,这就属于非线性划分问题。我们可以通过非线性映射将向量x映射到一个高维特征空间Z,在这个高维特征空间中构造最优平面或推广的最优分类超平面。即通过函数Φ:Rn→Z将所有样本点映射到高维空间,将原来的xi·xj变为Φ(xi)·Φ(yi)形式,记核函数K(xi,xj)=Φ(xi)·Φ(yi)。常见的满足Mercer条件的核函数有多项式核函数K(xi,xj)=[(xixj)+1]d和高斯径向基核函数(即RBF核)
  该策略的主要思想是对N分类问题构建N个支持向量机,每个支持向量机负责区分本类数据和非本类数据。最后结果由输出离分界面w·b+b距离最大的那个支持向量机决定。
  2.3.3 层次策略
  该策略的主要思想是对N分类问题构建若干个支持向量机,且它们之间是有层次地连接成一个有向无环图的结构,分类结果根据图经过的若干个支持向量机的判别得到。
  
  3 算法模拟
  
  CGM-OC-SVM算法是用C语言编写的,并选择RBF核作为核函数,现应用该算法分别对平面上两点和多点训练样本点进行分类训练、算法模拟。
  (1)设x,y平面上的2个训练样本点为α=(1,1),b=(2,3)
  假设训练集为S={(a,-1),(b,1)},其中a是-1类点,b是+1类点。取核参数δ=1,惩罚参数C=2时,采用改进的CGM-OC-SVM算法求解得α*=(1,1),设定x,y平面上的一点为k=(x,y),分类函数为:,
  内层迭代次数为1,外层迭代次数为1。利用Matlab分别作其三维、二维模拟图,见图3(a)和(b)。
  图3
  (2)设x,y平面上的5个训练样本点为a=(3,1),b=(4,2),c=(8,0.3),d=(2,3),e=(3,4)
  假定训练集为S={(a,-1),(b,-1),(c,-1),(d,1),(e,1)},其中a,b,c是-1类点,d,e是+1类点。取核参数δ=1,惩罚参数C=2时,采用改进的CGM-OC-SVM算法求解得α*=(0.801222,0.799457,0.799498,1.200462,1.20044),设定x,y平面上的一点为k=(x,y),分类函数为:
  内层迭代次数为1,外层迭代次数为1。利用Matlab分别作其三维、二维模拟图,见图4(a)和(b)。
  图4
  
  4 结束语
  
  由于支持向量机是建立在统计学习理论的VC维理论和结构风险最小原理的基础上,根据有限样本在学习精度和学习能力之间寻求最佳折衷,因此具有最好的推广能力。提出的CGM-OC-SVM算法改进了PRP-SVM算法只能选择多项式核函数的缺点,具有通用性。
  
  参考文献:
  [1] 邓乃扬, 田英杰. 数据挖掘中的新方法——支持向量机[M]. 北京:科学出版社,2004.
  [2] 张学工. 关于统计学习理论与支持向量机[J]. 自动化学报,2000,26(1).
  [3] 黄琼英. 支持向量机多类分类算法的研究与应用[D]. 河北:河北工业大学,2005.
  [4] E.Osuna, R.Freund, and F.Girosi Support Vector Machines: Training and Applications A.I. Memo 1602, MIT Artificial Intelligence Laboratory, 1997.
  [5] Zhang Ling, Zhang Bo. Relationship between Support Vector Set and Kernel Functions in SVM, J.Comput.Sci.&Technol,2002,17(5):549.
  [6] O Chapelle,V Vapnik et al.Choosing Multiple Parameters for Support Vector Machine[J]. Machine Learning,2002,46:131-159.
  注:本文中所涉及到的图表、注解、公式等内容请以PDF格式阅读原文。
其他文献
你是否遇到过在Word中处理文字时需要计算一些数据的情况呢?你是不是还要拿起手中的计算器或者借助于系统附件中的“计算器”来计算呢?  你想过利用Word也可以进行计算吗?哈哈,Word还真有快速计算能力。并且其功能要远远强于你的“计算器”,下面我们就来看一下在Word中进行数值计算的两种方法。    “Ctrl+F9”法  例如要计算“1140+3215-1563x219÷101.4+18.9^9
期刊
摘要:在剖析传统家电故障维修方式和需求的基础上,提出了一种基于神经网络和信息融合技术的智能家电故障测控系统的基本框架。该系统不仅能满足不同的智能家电需要不同的QoS保证,而且切实可行。依托该系统,可以提高我国家电企业故障诊断与维修的水平和效率,节省检测和维修成本并使产品具有更大的竞争力。同时,对将人工神经网络和信息融合技术引入到家电维修行业进行有益的探索。  关键词: 神经网络;信息融合;智能家电
期刊
近日,我们有两个网站在同时开发,这就需要不断在两个网站之间切换,每次都要更改网站的主目录。有没有一个方法可以实现利用一台服务器,架设多个网站,都能同时访问呢?经过摸索,终于实现了这个目标。以下是具体的方法。(在Win2000 Sever中+IIS 5.0测试通过)  首先我们需要在WEB服务器建立两个文件夹,用来存放两个网站所需文件,笔者是在“Web服务器”(Web服务器主目录)目录里面建立“Fi
期刊
WPS 2003丰富的边框样式和独到的图文混排功能至今深受广大用户的喜爱,但在处理文档中的图片过程中。有时会遇到一点小麻烦。如插入一幅图片后。右键单击图片在弹出的快捷菜单中左键单击“叠放次序”-在文字下。就可以把图片置于文字之下。做成简单的水印效果。  但我们在完成文档中的其它操作后,返回头来想调整图片的位置及“水印”效果(对比不明显示,主次不分)时。却发现图片不让动了。如果进行的其它操作步骤较少
期刊
酷暑又到了,你的电脑是否又开始挥泪如淋?过高的温度给自己心爱的电脑造成额外的负担,CPU太热的话,会导致机器运行不稳定甚至是电脑配件的烧毁,而CPU作为整个电脑的重中之重,所以也一直受到大家普遍的关注。如何在酷暑让电脑轻松的工作,这才是每个电脑用户首先要做的事,对于电脑用户而言,应该了解CPU散热器的选购要决。    散热的重要性    为什么要散热,这很显然是电脑配件的发热太高,导致温度急速上升
期刊
摘要:随着通信技术与多媒体技术的飞速发展,以多媒体视频为主的应用得到了广阔的发展,在这些视频应用领域中,若想进行图像处理就要先进行视频捕获。鉴于此,文章对Windows系统下的VFW体系结构进行了论述、给出了视频开发的相关Windows API函数,分析了视频捕获的工作流程;并用VB来设计和实现视频捕捉程序,具体的给出了程序的代码,最后给出了测试结果,证明是可以捕捉的。  关键词: VFW;视频捕
期刊
在暑期中,一些朋友除了外出旅游外,更多的时间或许会选择在家里度过漫长的暑假,电脑、网络则成为最好的娱乐工具,尽管Vista及3D游戏带来了更好的视觉享受。但需要一款合适的显示器搭配才能体现逼真效果,人们越来越渴望大屏液晶显示器,22英寸宽屏LCD成为暑期促销的热点,也是消费者购机的首选标准配件,而用户如何在暑期中选购则成为关键问题。  随着LCD显示器市场成熟,在今年暑促中。厂商改变了以往价格战为
期刊
又快到暑期了,你一定会陪家人去逛旅游,带孩子去公园玩耍,用数码相机永远抓住这美好瞬间,并将其刻录到光盘中保存,不仅可以将它与别人分享,还方便未来自己重温当日的快乐。对于一张装有重要意义内容的光盘而言,将自己喜欢的照片打印在盘面上。这将给带来更无比的DIY乐趣。    选择合适的打印方案    要让光盘盘面具有个性图案,可以采用光盘贴纸打印、光盘直接打印两种方法,光盘贴纸打印是先将图案设计好,然后用
期刊
摘要:Web应用在界面易操作性方面的弱点是制约其广泛应用的重要因素,AJAX技术正是为了克服这些缺点而被提出的。它是web应用的一种新的方式,AJAX为浏览器与服务器交互较多,频繁读取数据的Web应用提供了一个很好的解决方案。本文论述了AJAX模型的架构及其关键技术,并分析了AJAX技术在实现过程中的优缺点及其安全性。  关键词:AJAX;XMLHTTPRequest;XML;Web应用  中图分
期刊
摘要:ERP为我国企业注入活力,现在懂得ERP的人才越来越被重视,如何适应形势发展的需要,教师上好这门课,学生学好这门课,本文主要阐述了一些ERP的教学方法和学习方法,希望对学习这门课有所帮助。  关键词:企业资源管理计划;课程;学生  中图分类号:G642文献标识码:A文章编号:1009-3044(2007)15-30880-02  The Instruction & Learning of E
期刊