支持向量机与神经网络算法的对比分析

来源 :科学导报·学术 | 被引量 : 0次 | 上传用户:acxyvpfag
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘要:统计学习理论建立在结构风险最小化原则基础上,专门针对小样本下的机器学习问题而建立的一套新的学习理论体系。基于统计学习理论的算法具有理论完整、全局优化、适应性强、推广能力好等优点,是机器学习研究的新热点。本文首先研究了支持向量机的基本理论,接着对支持向量机算法和神经网络算法进行了全面性能比较。最后对文章整体做出总结,并写出了自己的感悟。
  引言
  分类一直是数据挖掘、机器学习[1] 和模式识别中一个重要的研究领域。随着计算能力、存储、网络的高速发展,更需要发现更深层次的规律,对决策,商务应用提供更加有效的支持。为了满足这种需求,数据挖掘技术得到了长足的发展,而分类在数据挖掘中是一项非常重要的任务。分类算法历来受到许多领域研究者的关注。
  传统的机器学习分类算法,如支持向量机等,慢慢不像十多年前那么火热。但在进行小数据样本处理时,支持向量机算法展现出基于大数据样本的深度学习无法取代的优势。因此对支持向量机和用于深度学习的神经网络算法的对比分析就显得尤为重要。
  1  概述
  1.1背景
  统计模式识别、线性或非线性回归以及人工神经网络等方法是数据挖掘的有效工具,但多年来我们也受制于一个难题:作为深度学习的燃料,在实际的问题中并非一定会有海量级别、带有标注的数据。传统的模式识别或人工神经网络方法都需要较多的训练样本,而许多实际课题中,已知样本较少,对于小样本集,训练结果最好不一定是预报能力最好的模型。[3] 而SVM 只需要很小的数据就能找到数据之间分类的超平面,得到很不错的分類结果。
  1.2现状
  数据是机器学习的燃料,包括模式识别、神经网络等在内的现有机器学习方法重要的基础是传统的统计学,基于传统统计学研究的是样本数目趋于无穷大事的渐进理论,当样本有限的时候,难以达到想要的效果。统计学习理论(Statistical Learning Theory,SLT)则着重提出了小样本情况下的统计规律和学习方法性质,发展出一种新的通用学习方法--支持向量机(Support vector machine,SVM)。当前关于支持向量机研究的热点主要是对支持向量机中算法的优化,包括解决SVM中二次规划求解问题,对大规模SVM的求解问题;另外就是如何提高SVM的归纳能力和分类速度以及根据具体问题确定核函数等。
  2 支持向量机
  支持向量机是一种基于统计学习理论的模式识别方法,主要应用于模式识别领域。20世纪末,由于研究不够完善,在解决模式识别问题中往往趋于保守,且数学知识匮乏,导致这些研究没有得到充分重视。直至统计学习理论(Statistical Learning Theory,SLT)的实现以及新兴机器学习方法如神经网络等研究遇到瓶颈,使得SVM迅速发展。
  2.1 SVM基于统计学理论的基础
  (1)对实际输入的结果输出标签时,风险可以用错误率进行表示。
  (2)VC维理论:一个假设空间的VC维,是该假设空间中可以解决分类问题的方程数目的度量。
  (3)SVM算法要求的样本相对比较少。
  2.2 支持向量机算法的基本原理
  SVM以结构风险最小化为理论基础,以寻找最优分割超平面进行建模,引入松弛变量和错误代价系数处理数据不可分和存在噪声的情况。这使其在训练样本有限的情况下能够有效避免过拟合问题,从而提高算法的泛化性能。
  2.3 最优分类超平面
  支持向量机中最简单也是最早提出的模型是最大间隔分类器。最初仅用于处理两类分类问题,核函数的引入使其具有构建非线性分类边界的能力。通过寻找一个分类超平面,能够使支持向量和超平面最小距离的最大。支持向量机通过对分类间隔最大化来控制泛化能力,将二维空间推广到高维空间,最优分割线就成为最优分类面,即最优超平面。
  2.4 核函数及其特征空间
  支持向量机中研究的两个关键因素分别是数学规划及核函数问题。通过引用核函数,将当前维度下线性不可分的训练数据映射到更高维度的特征空间,将问题转化为高维空间中线性可分问题,然后构建相应的分类超平面。
  核函数的选择一般考虑使用径向基函数。其关系到支持向量机的性能,只要参数选择合适,支持向量机可以对任意具有这一性质的数据集进行分类。
  3 SVM和神经网络对比分析
  3.1 非线性学习能力
  随着理论的逐步发展,由于核函数的引入,支持向量机通过变换将非线性输入映射到高维特征空间,然后再进行最优化求解,使其有效的处理非线性学习问题。
  神经网络由大量神经元组成,自身是非线性的。并且非线性是一种分布于整个网络中的特殊性质。正是由于神经网络的这种非线性性质,使得它表现出复杂的智能处理能力和非线性处理能力,并成功应用于多个领域。
  3.2 模型结构
  神经网络是一种层次网络结构,可分为输入层、卷积层、池化层、全连接层及输出层等部分。
  支持向量机的模型结构与神经网络的模型结构相类似,它相当于一个隐层的三层BP网络,在支持向量机中的支持向量对应于神经网络中的隐含层。
  3.3 神经网络的特点
  神经网络在生物神经学研究基础上提出,是对人脑神经组织结构和行为的模拟。神经网络通过使用计算单元间的相互连接来获得好的学习结果。其计算能力有以下特点:大规模并行分布式结构;具有自适应性和容错能力,可以实现联想记忆以及聚类等自组织学习;理论上神经网络可以逼近任何的连续函数,若神经元足够多,还可以逼近任何具有有限断点的非连续函数;一般在小样本情况下,经验风险与实际风险的差异比较明显,学习效果不佳。
  3.4 支持向量机的特点
  系统结构简单,无需过多的先验知识;SVM以统计学中结构风险最小化为理论基础,以寻找最优分割面进行建模,通过引入松弛变量和的撒四家系数避免出现过拟合的问题;支持向量机通过最优超平面进行学习,具有全局最优性。
  4 总结
  本文的主要内容包括:关于深度学习的神经网络以及传统机器学习算法支持向量机的发展现状;对支持向量机中的发展、算法理论以及重要部分作出分析研究;分析比较支持向量机以及神经网络这两种应用广泛的学习机器进行全面的性能比较,并深入分析了支持向量机的良好学习性能和具有的诸多优势。
  参考文献:
  [1] 张学工译.统计学理论的本质.北京:清华大学出版社,2000,1-226
  [2] 曾志华,张银奎译.机器学习.北京:计协工业出版社,2003,1-13
  [3] 范胜龙,茹凯丽,陈巧燕.清华大学资源与环境学院,基于BP神经网络和支持向量机的农用地分等方法研究
  [4] 郭月,基于SVM的高分图像自动分类算法研究与系统实现
  [5] VAPNIK V N. 统计学习理论的本质[M],张学工,译. 北 京:清华大学出版社,2000:2 -6.
  [6] 宋杰,唐焕文. 基于线性规划的支持向量机分类器,大连理工大学学报,2005,45
  [7] 阎威武,支持向量机理论、方法与应用研究[上海交通大学博士学位论文],上海:上海交通大学电子信息与电气工程学院,2003,89,106
  [8] 张小云,刘允才,高斯核支撑向量机的性能分析,计算机工程,2010,29(8)22-25
  (作者单位:郑州大学软件与应用科技学院)
其他文献
摘要:随着我国经济建设水平的不断提升,人们对生活的质量需求也不断的增长,建筑业是社会发展过程中必不可少的重要内容,我国可持续发展战略提出的成功性,让绿色施工管理理念成为了建筑施工管理过程中不断发展的主要方向,绿色施工管理工作的实施,能够全面提高工程建设水平和质量,满足人们的建设需求,做好环境保护工作,为了推进这一工作内容都稳定实施,我国出台了很多相关的政策和方案来作为支持。本文主要探讨了绿色施工管
期刊
摘要:近年来,随着我国经济的快速发展,城市化进程也不断加快,城市的形式和功能也在不断地丰富。为了促进城市的良性发展,需要做好城市的规划,对城市进行合理的区域布局,满足城市未来发展的需要。总图运输设计是工业企业设计的一种方式,其同样可以用于城市规划领域,让城市规划更加地合理。本文主要研究总图运输设计在城市规划中的作用。  关键词:总图运输设计;城市规划;作用  引言  随着国家经济的迅速发展,城市的
期刊
摘要:随着我国经济快速发展,我国建筑工程建设的施工技术取得飞快的发展,为我国基础工程建设做出了重要的贡献。建筑工程建设的监督监管水平以及质量控制质量直接决定了施工企业的经济效率。因此本文在此基础上就建筑工程施工现场安全监督管理的相关问题做了一定的探析,从而更好促进施工企业的健康发展。  关键词:建筑工程施工阶段;质量监理控制;施工效率  建筑工程建设项目对于我国的经济发展十分重要,它保证了我国基础
期刊
摘要:本文总结出了实施项目管理的基础框架以及应用信息技术和变革管理模式的问题及对策,最后对应用过程中的一些问题和经验进行了探讨。结合通信工程设计的实践对项目管理如何在我国的通信设计中得以应用进行探讨。  关键词:管理模式及对策;以人为本;以流程为核心;科学化;规范化  笔者从事通信工程设计管理工作多年,通过对多个通信工程通信设计院项目管理的调查和规划,总结出了实施项目管理的基础框架以及应用信息技术
期刊
摘要:近些年来,随着教育事业的发展和学生压力的增加,越来越多的学生视力开始下降,在一定程度上推动了眼镜行业的发展,但是由于金融危机爆发的影响,导致眼镜行业面临着前所未有的挑战。不管是眼镜设计,还是眼镜生产与流通都会遇到一定的困难,在一定程度上阻碍了眼镜行业的发展。本文将会对我国眼镜行业发展现状进行分析,并提出眼镜设计的发展对策,以期更好的推动我国眼镜行业的创新与发展。  关键词:眼镜行业;眼镜设计
期刊
摘要:随着环境污染愈发严重,工业生产作为环境污染的首要污染源,应该从根本上解决其工业生产的污染问题。清洁生产作为新型环保产业的良性发展,可以通过生产中的每个环节采取相关防御措施,企业要注重基本管理,构建清洁生产理念,使用先进的生产清洁设备与清洁技术,重视环保节能技术改造,以此促进生产企业的良性发展。本文对清洁生产促进环保产业良性发展进行探讨。  关键词:清洁生产;环保产业;良性发展;促进作用  前
期刊
摘要:现阶段,随着工业的高速发展,污水问题日益严重。污泥当中具备着适合微生物生存的重要环境,微生物可以通过获取养分从而在污泥当中生长繁殖。因此,可以通过培养微生物的方式,使污水当中难以降解的有机物得到有效降解,从而达到净化污水的目的。活性污泥法借助这一原理已经成为污水处理的重要方式之一,因此,本文对运用活性污泥法进行污水处理进行研究。  关键词:活性污泥;污水处理;微生物  活性污泥是现阶段处理污
期刊
摘要:在当今社会经济发展迅速技术飞跃进步的前提下,建筑企业的数量与规模越来越多,竞争压力也就越来越大。为此,而在发展中存在的问题,还对建筑企业内部的生产模式和人员的分配合理性提出了更高的要求。由于建筑企业管理的水平高低会对工作效率和工作成果的大小有着决定性的作用,所以企业要从提升自己本身的管理水平作为企业发展过程中重视的问题。基于此,本文主要从建筑施工中出现的问题和问题的解决方案进行了探讨研究,仅
期刊
摘要:配电线路在电力系统中是保障电力传输的关键,其故障情况和运行通畅情况都会对降压变电站相对配电变压器送电过程产生直接的影响,另外对配电站向用户的供电过程也会造成影响。本文就主要围绕这一问题对电力系统中配电线路运行故障检测技术进行简要的分析。  关键词:电力系统;配电线路;运行故障检测技术  引言  发电企业、电网企业、电力用户等是构成电力系统的三个主体部分,而各主体之间联系的纽带就是配电线路。因
期刊
摘要:施工结果的特点决定了施工工作必须采用先进的技术管理,以保证工程质量和产品质量。作为基础单位建设技术方向的长期工作人员,我深知在实践中,技术管理可以降低施工成本,有效控制工作流程,对于保证工作质量至关重要。本文侧重于建筑行业的技术研究。  关键词;施工技术;应用;措施  1.传统的建筑行业施工技术  在建筑行业中,传统的建筑施工技术主要有桩基技术和基坑支护技术两种,下面我们分别来看。  1.1
期刊