支持向量机中的优化关系推导

来源 :科学与生活 | 被引量 : 0次 | 上传用户:liwuyi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  [摘要]支持向量机(SVM)是通过寻找最优分离超平面实现分类的目标。但是这个过程涉及负责的逻辑过程。本文通过详细解释SVM的相关逻辑关系,展示了SVM中解决优化问题的一般性数值关系推导。
  [关键字]支持向量机;分离超平面;优化问题;最大化间隔
  Vapnik[1]提出SVM算法[2,3,4]用于解决两类问题,第一类是线性可分的问题第二类是线性不可分问题。本文讨论svm能够解决的线性可分问题为例,介绍SVM。
  注意到,使用margin最大的条件来求解支持向量引出的问题就是这样的直线并不唯一。理论分析表明,支持向量机寻找的最优的分类直线应该满足:(1)该直线分开了两类;(2)该直线最大化了间隔(margin);(3)该直线处于间隔的中间,到所有支持向量的距离相等。即支持向量就是分离超平面最近的那些点(“最近的意思是,点和直线可以刚好相交”)。支持向量机就是寻找空间中的一条能够将类别不同的对象以最大间隔分割开来的直线,这条直线与两侧的支持向量直线的距离相等。
  上述关于是基于二维特征空间的结果,而在高维空间中,直线将变成超平面。理论表明,上述结论却是一致的。现在,我们开始寻找最优的分类超平面的过程。为了说明这个问题,我们首先看“线性可分”的定义:
  假定训练样本是线性可分的,SVM需要寻找的是最大化间隔的超平面,则这个优化问题可写成如下形式:
  之所以有以上关系,是因为,我们可以假定w是一个m维的向量具体的,设,则,||w||2=w12+w22+ ... wm2。这就是说,SVM的优化问题就是最小化w模的平方,且有N个限制条件。为了推出这个优化问题,我们注意到如下两个事实:
  2 二次规划
  定义:二次规划[5,6]的定义包括两个条件:(1)目标函数是二次项;(2)限制条件是一次项。
  在最优化理论中,如果一个问题是凸优化问题,我们就可以把它当成一个已经解决的问题。因为凸优化问题只有唯一一个全局的极值。我们可以用梯度下降法来求得它的解。
  3 线性不可分及其求解
  如果训练样本线性不可分,那么以上优化问题的解释什么?显然是无解。即不存在(w,b)使得它满足上述N各限制条件。对于线性不可分的情形,我们需要适当放松限制条件,使得上面的优化问题变的有解。放松限制条件的思路是,对于每个训练样本xi与其标签yi,我们需要设置一个松弛变量δi。于是,我们可将上面的N个不等式的限制条件放松为如下的限制条件:yi(wTxi + b)≥1-δi ,(i=1 , ... , N)。
  那就是说,在线性不可分的情况下,我们不可能让所有的yi乘以wTxi + b大于等于1。于是,注意到,我们引入δi,作用到不等式的右边,可以看到,只要每个δi足够的大,那么,上面的N个不等式的限制条件都是可以成立的。当然,我们应该增加新的限制条件以阻止δi无限变大,让它限定在一个合理的范围内。最终,我们可以获得改造后的SVM的优化版本:
  两个限制条件分析如下:第一个条件保证每个δi是大于等于0的。限制条件(2)将以前的难以达到的不等式变的容易达到。再看目标函数,以前的目标函数只需要最小化模的方的一半,而现在的目标函数增加了一项,即所有的δi的总和,这就不但要求w的模越小越好,还要求每个δi的和越小越好。
  在这里强调的是,平衡两项的比例因子C是认为设定的,我们把一个算法中,人为设定参数叫做算法的超参数(hyperparameter)。一般来说,在实际应用中,我们会不断的变化C的值,同时对每个C,我们要测试算法的识别率。然后我们选取识别率达到最大的超参数C的值。显然如果一个算法的超参数越多,意味着算法需要手动调整优化的地方越多,这样算法的自动性就会降低,SVM是超参数很少的算法模型。
  4 从低维到高维的映射
  這里我们要考察的是如何扩大考察函数的范围,从而提高处理非线性可分数据集的能力。SVM在扩大可选参数范围方面可谓独树一帜。其它算法,如ANN,决策树等采用的是直接产生更多可逆函数的方式。例如ANN中,通过多层非线性函数的组合能够产生类似于椭圆的曲线,从而区分比如由圆圈(○)包围的叉(×)。SVM不是直接产生这样的函数,而是通过将特征空间由低维映射到高维,然后在高维特征空间当中仍然用线性超平面对数据进行分类。
  这里有一个一般性的结论需要强调一下:假设在一个M维的空间上,随机取N个训练样本,随机的对每个训练样本赋予标签+1或者-1.并假设,这些训练样本线性可分的概率为P(M),则当M趋于无穷大时,P(M)=1。
  关于这个结论,直观上很容易理解,即当我们增加特征空间的维度M的时候,超平面待估计的参数(w,b)的维度也会增加。也就是说,整个算法模型的自由度会增加,当然,就更有可能分开低维时候无法分开的数据集。上述结论告诉我们,将训练集样本由低维映射到高维,能够增加线性可分的概率。因此,我们如何构造一个由低维到高维映射函数就成为关键性的问题。在从低维到高维的映射过程中,我们要注意核函数的使用规则:核函数K和映射函数是一一对应的关系,知道其中一个,就可以知道另一个。
  5 举例 - 兵王问题
  兵王问题是,如果在国际象棋中的残局,黑方只剩下一个王,拜访还剩下一个兵一个王,那么将有两种可能:第一,白方将死黑方,白方获胜。第二,和棋。
  这两种可能是三个棋子在棋盘的位置而确定的。为了让大家对这个问题有更直观的了解,需详细的说一下与之关联的国际象棋规则,其中有一条规则叫做“兵的升变”。也就是说,并走至对方的底线,可以升为除王外任意棋子。第二条规则就是“逼和”,也就是说,一方的王未被将军,但是下一步它移动到任意的地方都会被对方将死,则此时是和棋。
  从这个规则中我们可以大致了解到,黑方要想防止自己被将死,有一个好消息,和一个坏消息。坏消息是,黑方必须防止兵走到底线,升变为王,这样的强子。往后可以横竖斜走若干步。若王后和王一起配合,一定可以将死对方的王。而好消息是,黑方可以利用逼和的规则,主动造成无路可走的情形,从而导致和棋。   接下来就是一个神奇的事:我们在不输入计算机规则的前提下,利用SVM,我們可以让计算机学会判断兵王问题是白方胜还是和棋。这是一个二分类问题。
  首先,我们需要标注好的训练数据集,在著名的UCI ML数据集上,我们可以下载到兵王问题的数据。在这里,我们用SVM来处理这个问题。首先我们将和棋标签标为drw当做一类。设定此时的yi=±1。将其它标签从1到x当做另一类,设定此时相应的标签yi=-1接下来我们用SVM的程序进行训练,我们用LIBsvm工具包,就可以得到相应的超平面方程。
  [结束语] 本文详细分析了支持向量机解决优化问题过程中的数值关系,并给出了相关的数学推导,为初学者后续的相关课题学习研究给予指导。
  [1] Guyon I , Weston J , Barnhill S , et al. Gene Selection for Cancer Classification using Support Vector Machines[J]. Machine Learning, 2002, 46(1-3):389-422.
  [2] Bi J , Vapnik V N . Learning with Rigorous Support Vector Machines[C]// Computational Learning Theory and Kernel Machines, 16th Annual Conference on Computational Learning Theory and 7th Kernel Workshop, COLT/Kernel 2003, Washington, DC, USA, August 24-27, 2003, Proceedings. DBLP, 2003.
  [3] Tao Y , Zhu X , Huang D , et al. Soft Sensor Modeling Based on the Soft Margin Support Vector Regression Machine[C]// IEEE International Conference on Control & Automation. IEEE, 2007.
  [4] Chapelle O , Vapnik V . Model Selection for Support Vector Machines. 2000.
  [5]Fei S , Lin Y , Saul L K , et al. Multiplicative Updates for Nonnegative Quadratic Programming[J]. Neural Computation, 2007, 19(8):2004-2031.
  [6]Kleinhans J M , Sigl G . GORDIAN: VLSI placement by quadratic programming and slicing optimization[J]. IEEE Transactions on Computer-Aided Design of Integrated Circuits and Systems, 2002, 10(3):356-365.
  广州工商学院 广东省佛山市 528138
其他文献
摘要:关于历史进程的规律性问题,存在三种不同观点:退步论、循环论和进步论。历史退步论是古希腊所流行的思想,古代中国也有历史退步论的思想夹杂其中,但古代中国更多的认为历史是循环的,正所谓“天下大势,分久必合,合久必分”,而进步论是斯塞宾提出,然后才被人接受。  关键词:螺旋式上升;循环论;假象  一、引言  关于历史进程规律性的三种观点:退步、循环与进步。退步论与循环论比进步论更早提出,也更被人们所
期刊
摘要:伴随着环境保护工作的逐步开展,为了有效提升环保管理效果,相关部门在环境艺术设计的过程中,要秉持绿色设计理念,践行统筹性管控规则,发挥绿色设计理念的时代价值,从而建构完整的设计规划体系,促进环境艺术设计项目的全面进步。本文分析了环境艺术设计中绿色设计理念的原则,并对具体应用要点展开讨论,仅供参考。  关键词:环境艺术设计;绿色设计理念;原则;要点  一、环境艺术设计中绿色设计理念的原则  在环
期刊
摘要:非金属矿物是当前社会发展中比较重要的一类材料,在现阶段的非金属矿物加工过程中,环境污染和破坏问题越来越严重。重点针对非金属矿物加工及其环境保护的内容从表现问题及其相应优化措施两方面进行了分析和论述。  关键词:非金属矿物加工;环境保护;问题;措施  社会发展中很多方面都需要对非金属矿物进行应用,当前比较常见的就有超细粉碎、精选提纯、表面改性、非金属矿物材料、非金属矿物化工等,尤其是随着当前社
期刊
摘要:环境设计是以一门现代环境科学研究为基础的正在发展中的新兴学科,是现代艺术设计众多分支中的一门边缘学科。即一种以整合建筑室内外的空间环境为目的实用艺術,而这种目的的实现需要依靠艺术设计的手法来实现。传统意义上的环艺设计涉及诸多学科,联系门类十分宽泛。同建筑学科的联系尤为紧密。环境艺术设计是结合了“技术”与“艺术”二者的深刻内涵而形成的一门艺术设计学科。本文旨在阐述环境艺术设计的定义与发展、专业
期刊
摘要:目前,随着我国社会经济的不断发展,我国农业技术也加快了发展步伐,在玉米种植过程中应用新型的种植技术,可以有效的节省经济成本。技术人员可以通过对玉米高产种植技术的应用,对土地资源进行充分利用,避免出现资源浪费的现象,极大的提高玉米产量。本文就对玉米高产种植技术及病虫害防治措施进行深入探讨。  关键词:玉米;高产;种植;病虫害  农业发展对于我国经济的迅速推进具有非常重要的意义,因为其直接关系到
期刊
摘要:随着一个倡导解放个人天性,注重自我意识与个人风格表达的时代,传统的风格思维定式已经日渐消退。简单的风格定义在当下显示出其种种忽视居住者个体需要,缺乏融合性的弊端,很难满足日渐发展的多元化居住需要。去风格化、打造具有独特“人格化”的居住空间也就成为了新的设计趋向。本文便以”去风格化的居住空间设计趋向”为主题,对“人格化”居住空间的打造方式和意义进行探讨。  关键字:居住空间;室内设计;人格化;
期刊
随着各电商平台网络直播的兴起,直播带货作为销售渠道之一其作用越加突出。在新型冠状病毒肺炎爆发的背景下,众多短视频平台推出农产品直播渠道,如淘宝的村播计划,助力农产品销售。直播在农产品电商中的运用,在一定程度上缓解了农产品电商的流量瓶颈,直观,全面呈现的产品,提升了消费者的转化率。随着直播在农产品电商领域的应用加深,内容同质化、专业主播匮乏等一系列问题也随之产生,探索如何借助网络直播发展农产品电商,
期刊
摘要:透明质酸是一种存在于生物体内的大分子聚合物,化学成分为粘多糖,广泛存在于动物和人体结缔组织及细胞外基质中,具有特殊的生理作用和极强的保湿能力。可广泛应用于医药、临床医学等领域。本文对鱿鱼眼透明质酸的提取方法进行了研究,实验采用水提醇沉、等电点法脱蛋白质与超滤相结合的加工工艺,运用正交试验法对提取工艺参数进行了优化,并对产品的质量指标进行了检验。  关键词:透明质酸;鱿鱼眼;提取工艺;鉴定  
期刊
摘要:随着我国的发展和社会的进步,各行各业的科学技术水平都有了很大的提高。油田流量计就是其中的一个重要体现。现场标定技术的应用可以有效提高工作质量,保证相关数据的准确性,为油田流量测量提供强有力的数据支持。在流量计的实际应用中,可以提高校准技术水平,进一步提高原油校准水平。本文对现场流量计的校准技术进行了分析,并提出了一些可供参考的建议。  关键词:企业;流量计量仪表;现场标定技术  中图分类号:
期刊
摘要:“成渝双城经济圈”是中国第四个带动区域发展新的经济增长极,肩负经济区与行政区适度分离改革使命的川渝高竹新区作为成渝双城经济合作示范区的重要组成部分。其区域社会事业发展对于加快建设以高竹新区为纽带的渝广两城,形成优势互补的区域协调发展新格局起着关键作用,因此,高竹新区面临全面建立人才管理体制和运行机制的任务。当前高竹新区人力资源管理亟需解决的问题是如何形成独特的人才支持政策体系。在借鉴传统人才
期刊