基于加权增量的支持向量机分类算法研究

被引量 : 0次 | 上传用户:doraemon1226
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
支持向量机(Support Vector Machines,简称SVM)是由Vapnik等人于上世纪末提出的一种新的机器学习技术,它是统计学习理论的核心部分,具有全局最优、结构简单、推广能力强等优点,目前在模式识别、信号处理、控制、数据挖掘等多个领域都得到了广泛的应用。但是经典的支持向量机不支持增量学习,在大规模数据的情况下,训练速度会下降,因此提高学习算法的分类性能对SVM增量学习的研究具有重要的理论意义和实用价值。本文主要的研究工作是,在现有支持向量机算法的基础上,寻找一种新的基于加权增量的支持向量机学习算法,使得该算法在大规模数据样本的情况下,仍然能取得较好的分类性能。该算法的改进主要体现在以下两个方面:一是由于噪声和其他多种不确定因素的存在,使得某些样本严重偏离所属的类别,而现有的增量算法在处理样本时要求训练数据彼此独立、且具有相同的分布规律,对所有样本同等对待,这显然对于正常分布的样本不公平,因此应该采用一种处理加权分布信息的识别算法;二是在增量学习过程中,研究了支持向量机寻优问题的KKT条件与样本分布之间的关系,在保留原有支持向量的基础上,观察到违背KKT条件、以及满足KKT条件且与原分类面距离较近的这两类样本,在新一轮训练之后转化为支持向量的可能性比较大,算法通过选取这些样本既有效地保留了样本的类别信息,也及时剔除了对后续分类影响不大的样本,提高了算法处理大规模数据量的能力。论文各章节的主要内容概括如下:第1章介绍了支持向量机的研究背景、研究现状,并给出了本文的研究内容;第2章对支持向量机算法的理论知识进行了概述,描述并比较了目前研究与应用较多的三种变形算法,为本文后续的研究方向与内容进行铺垫。第3章研究了增量式支持向量机算法的原理,对现有的三种比较典型的增量式支持向量机算法进行了分析和比较。第4章总结了现有增量算法的一些不足,在这个基础上提出了一种新的基于加权增量的支持向量机分类算法,并在标准数据集上对该算法性能进行了测试。最后第5章总结了本文的主要研究成果,并指出下一步的研究方向。
其他文献
文学文本拓宽了交际学的研究视野。美国华裔作家谭恩美的小说《喜福会》再现了美国主流文化和华人文化的互动关系。本文试图从交际学的视角剖析该小说中母女两代人的"异乡人"
Java是面向对象的编程语言,可以实现GUI的扫雷游戏需要设计不同的类,在此就如何运用Java实现图形界面下的扫雷游戏浅谈简单的算法与事件处理的基本实现。
“内刊”的信息开发初探张咏诗,刘纯兴天津南开区图书馆天津南开区图书馆“内部刊物”就是企事业单位,社会团体,在各地新闻出版局注册登记内部刊号,不公开发行的各类期刊报纸。过
文章分析了作战背景、各方的企图、兵力、作战保障能力、组织指挥和战略战术,阐述了桂南会战在抗日战争中的作用和历史地位,指出中日交战双方各有优劣、互有胜负,笼统地说中
电子游戏的发展经历了一个由最初的诉诸感官到后来的诉诸文化的过程。本文以恐怖游戏《寂静岭》为例,探讨了电子游戏在视觉文化传播领域的不断深入与拓宽。
本文以英语专业本科生为调查对象,采用问卷调查的方法,考察了他们学习第二外语的动机情况,旨在深入地探索大学生外语学习的动机。通过SPSS软件对数据进行了因子分析和多元方
R.Ellis于2003年提出外显意识增强式任务模式,他认为理想的语言形式教学应当既帮助学习者接触各种语言形式,提高其对语言形式的外显认识,同时又不忽视语言运用能力的培养。结合我
近年来,随着公民新闻在中国的实践不断深入和推进,"公民记者"现象也逐渐引起更多的关注和讨论。但严格说来,"公民记者"到目前为止还不是一个被学界普遍认同和使用的学术概念,
韩国的投资环境可分为软环境和硬环境。从投资的软环境看,韩国的经济发展态势良好,市场消费潜力很大,政府积极鼓励利用外资并出台了一系列有利于外商投资的政策与措施。从投