核空间聚类算法及其在大规模支持向量机应用中的研究

来源 :广西大学 | 被引量 : 0次 | 上传用户:liu3352
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
支持向量机因其坚实的理论基础与优越的学习性能已被广泛运用于大规模数据的学习中,但支持向量机优越性是建立在小样本的基础之上,在大规模样本的学习问题上它却并未表现出优势。大样本的学习问题已经成为支持向量机应用的瓶颈,因此提出有效的针对大规模训练样本集的SVM算法意义深远。   本文着重研究了支持向量机在大规模学习中的应用,在深入学习支持向量机理论的基础上,对现今各种大规模支持向量机的解决方法进行了总结分析,其中着重分析了聚类算法在解决大规模支持向量机的优势及存在的问题,并最终提出了一种解决大规模支持向量机学习问题的新策略。本文的主要研究工作有:   l、深入分析了现有大规模支持向量机的学习方法,找出目前研究中存在的问题,特别深入分析了用聚类解决大规模支持向量机各种方法,并对此进行归纳总结。   2、提出了用核空间聚类优化大规模支持向量机的新策略,该策略试图利用核空间聚类算法找出距离SVM中距离分类平面较近的对样本模型学习有贡献的支持向量,同时约减掉大部分对学习无贡献的非支持向量,最后包含支持向量的小部分样本用于新的样本学习,从而弥补了当前优化方法的不足,在提高学习效率的同时保证了SVM的学习性能。   3、提出核空间距离聚类算法(KDC),将该聚类算法与支持向量机相结合构建了基于核空间距离聚类的大规模支持向量机模型(KDC-SVM),利用KDC约减大规模数据集,最后通过实验验证了该优化模型的可行性。   4、针对KDC-SVM模型存在的一些问题:因采用大量随机机制而导致减样不稳定、压缩比例难以控制、自主学习性差等缺陷提出了基于蚁群核聚类的支持向量机学习模型(ANT-SVM),该模型利用提出的蚁群核聚类算法大规模数据集,使支持向量机在大规模样本学习时自主学习能力更强,能够更加迅捷地获得优越的样本模型。实验表明,改进的ANT-SVM模型其学习性能比较强,较KDC-SVM模型它能获得更加稳定的、性能更强的学习模型。   本文提出了用核空间聚类算法优化大规模支持向量机的学习策略,并利用KDC算法、蚁群核聚类算法约简大规模支持向量机训练集,改善了支持向量机的学习性能,同时为大规模支持向量机的应用研究提供了新的思路。
其他文献
随着信息技术的飞速发展以及人们对信息需求的日益迫切,搜索引擎已成为人们在网上搜索相关信息的一个必不可少的工具。在使用搜索引擎中,如何通过输入好的查询表达式来获得好的
本论文主要研究基于图谱理论的群组队形的表示方法和基于图谱理论的群组在复杂场景的控制方法。本研究最终实现的关键技术能够改进现有基于图谱理论队形控制方法对于有障碍物
遗传算法(Genetic Algorithm,GA)是一种求解复杂全局优化问题的仿生型算法。它以达尔文自然进化论与Mendel遗传变异理论为基础,运算对象是问题的编码,在进化过程中不需要任何梯
无线技术的发展极大的促进了人类生活和交流的方式,无线传感器网络(WirelessSensorNetworks,WSN)能够应用于布线困难和人员不能到达的特殊区域,实时监测和采集物理数据,并通过无线
视频监控系统的应用越来越广泛,银行、小区、仓库、监狱等对安全性要求高的场合都有视频监控系统的应用。但目前大部分的视频监控系统还是依赖操作人员的操作,准确性、实时性等
目前,我国物流企业普遍呈现规模偏小、功能单一、各自为政的特点,缺乏规模效应,不能提供完整的物流链。第四方物流通过整合各种物流资源来为用户提供一体化的物流服务。随着
伴随着计算机技术以及互联网技术的迅速发展,计算机应用技术在我国农业发展中的作用越来越重要。长期以来,农药作为农业生产中使用最普遍和最广泛的病虫害防治手段,然而,农药
随着互联网与多媒体技术的飞速发展,视频信息给人们的生活带来了巨大的便利。然而,面对如此庞大的视频数据量,如何有效的组织、存储、检索与浏览视频已成为视频研究领域中的
多重数字图像水印技术使用相同或者不同的密钥,在同一幅图片中多次嵌入水印,其目的是保证版权认证信息的安全。多重数字图像水印较之普通水印更具有强壮性和安全性能,在对数字产
学位
XML已成为网络数据表示和信息交换的标准。随着XML在各个领域的广泛应用,其安全性也更多地受到人们的关注。   本文针对XML安全问题,分析了RSA密钥机制和XML自身的特点,将XML
学位