基于JAVA的支持向量机分类的研究

来源 :中国石油大学(北京) | 被引量 : 0次 | 上传用户:guiminzhu18
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
支持向量机最初于20世纪90年代由Vapnik提出,是一种新的统计学习算法,其学习原则是使结构风险最小化,这使得支持向量机具有很强的泛化能力。近年来,支持向量机在理论研究和算法实现都取得了突破性进展,是数据挖掘中的一项新技术,开始成为克服“维数灾难”和“过学习”等传统困难的有力手段。 本文首先从支持向量机的理论入手,对SVM及其训练问题进行数学描述.SVM训练问题归结为解一个带有线性等式和不等式约束的大规模凸二次规划问题。在分析现有训练算法的基础上重点分析SMO算法,指出了原始SMO算法的缺陷,即核函数计算量太大占用了算法大量时间;子规划问题的第一个优化变量选取过于随机,从而影响整个算法收敛速度,然后针对上面的缺陷分别对原始的SMO算法进行了改进。最后在研究libsvm的基础上实现javasvm,通过仿真实验对比libsvm与javasvm。
其他文献
时序数据在日常生活中随处可见,对时序数据的研究和挖掘具有重大实际应用意义。本文主要研究基于时序数据的模式识别技术,分别从数据预处理、特征提取、模型建立、相似性搜索识
报表是企业查询各项数据的主要手段,各类信息系统都离不开报表服务。但中国报表一向以样式复杂、统计困难著称。多变的需求使得报表的开发、维护成本一直很高,给企业信息系统的
随着我国高新技术产业的发展很多人预测知识经济的变革即将到来,而变革的重点便是知识产权的保护。近几年来,软件制造行业在国民经济中占有的地位越来越重要,仅仅从该行业对GDP
机器学习是从大量、复杂的数据中迅速获取新颖、有效的知识的过程。基于核函数的机器学习方法是从统计学习理论中发展出来的较新的研究方法,它有效解决了传统机器学习方法的局
本论文主要针对鞍钢集团矿业公司目前在采矿、选矿生产中,原材料的计量管理中电子汽车衡的实际现状,通过采用RFID免接触无线自动识别技术及新的数据采集技术,利用鞍钢集团矿
基因表达式规划(Gene Expression Programming,GEP)是Ferreira Candida于2001年提出的一种新型进化算法,该算法继承了遗传算法编码简单和遗传编程的特点,采用线性定长方式对
由于时序数据区别于普通数据,为了达到有效的利用时序数据特征进行数据分析目的,本文针对时序数据特征提取方法进行了深入的研究,主要做了以下工作:(1)为了减小数据量,首先利用一
将CDN和P2P进行融合构成的混合内容分发系统能够充分结合两种技术的优势,提高系统的可扩展能力和可靠服务能力。本文针对CDN-P2P系统中底层P2P分发网络及其构造协议、CDN与P2
HART C8PSK(Highway Addressable Remote Transducer Coherent8-way sfhit key)协议是HART现场总线的第二代物理层协议,具有兼容HART现场总线第一代物理层协议HART FSK和速度
无线射频识别 (Radio Frequency Identification,RFID) 技术是20世纪90年代开始兴起的一种自动识别技术,是一种非接触的自动识别技术。它采用识别技术、通信技术,在大规模集成电