基于支持向量机的数据挖掘方法

来源 :山东大学 | 被引量 : 0次 | 上传用户:onlysimon
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
支持向量机是基于统计学习理论的新一代机器学习技术。由于使用结构风险最小化原则代替经验风险最小化原则,使它能较好地处理小样本情况下的学习问题。又由于采用了核函数思想,使它能把非线性问题转化为线性问题来解决并降低了算法的复杂度。目前,支持向量机已经成为国际上机器学习领域新的研究热点。 本论文首先概要介绍了支持向量机的理论背景,结合目前一些主要的支持向量机方法进行深入研究,提出新的见解。本论文的主要贡献可归纳为如下三个方面: 1.样本预优算法研究 论文首先介绍了一种可以减少大规模支持向量机训练时间和能减少野点影响的方法。很多支持向量机的算法都是从一个随机的训练数据的子集出发开始训练,本论文提出一种新的方法,在高维空间中估计出那些可能最终成为支持向量的向量集合,继而加速优化的过程。同时利用高维空间定义的距离来发现野点,并在一定程度上消除野点对最终分类面的影响。 2.提出高维中心支持向量机(HCSVM)方法 支持向量机利用少量数据来建立分类决策面。但是由于分类面只依赖于少量的支持向量,所以易受噪声数据影响。针对这种情况,本文提出了高维中心支持向量机(HCSVM)方法。该方法利用非线性可分数据映射到高维线性可分的特性,把数据映射到高维特征空间,将高维中心之间的距离最小作为优化的原问题。仿真实验表明,该方法在一定程度上减少了噪声数据对分类面的影响。 3.增量算法研究 增量算法已经成为智能知识发现方面一个重要的分类方法。在第五章中,笔者深入分析了支持向量集的特性,介绍了一般的增量学习算法。通过分析,指出在增量学习中确定学习参数比较困难,所以本文利用v-SVM
其他文献
问题是数学课堂的中心,是贯穿整个教学环节的枢纽,在实际教学中,教师应该引领学生去发现问题,提出问题,进而分析问题,解决问题,让他们在此过程中产生领悟和积累,获得数学层面
随着社会经济的不断发展,当今人才竞争越来越激烈,其本质上仍属于一种创新的竞争。对于一些司法警察院校来说,在人才培养过程中应该将学院的创新意识和创新能力当作培养关键,
当前,古帖类图书的出版进入一个相对繁荣的阶段,品类丰富,印刷精良,有很多人性化的设计,尽量满足各类消费者的需求。但这一类书籍在印前印后的技术控制以及文字编辑的学术规范等方
目的分析"五常法"提升重症医学科护理管理质量的实践及效果。方法选用"五常法"理论加以规范性的管理,对比两组前后某医院重症医学抢救成功率与患者的满意度差异。结果医护人
专利的国际保护,是指国与国之间通过签订多边条约,或者根据互惠和对等原则,对条约的成员国或者对对方国家公民、法人取得的专利权进行的保护。追求效用的最大化促成了专利国
目的探讨腹主动脉远端临时置入球囊在凶险性前置胎盘剖宫产中的临床应用。方法回顾性分析我科30例凶险性前置胎盘的临床资料,其中,12例在剖宫产术前行腹主动脉远端球囊临时置