并行支持向量机的研究与实现

来源 :北京工业大学 | 被引量 : 0次 | 上传用户：wgxwjl

【摘要】

：

支持向量机是在统计学习理论的基础上发展起来的新一代学习算法,该算法在机器学习、模式识别等领域都取得了很好的应用。但随着需要处理的数据量不断增大,支持向量机表现出计

【作者】

：

杨雅媛

【机构】

：

北京工业大学

【出处】

：

北京工业大学

【发表日期】

：

2007年期

【关键词】

：

机器学习支持向量机改进算法

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

支持向量机是在统计学习理论的基础上发展起来的新一代学习算法,该算法在机器学习、模式识别等领域都取得了很好的应用。但随着需要处理的数据量不断增大,支持向量机表现出计算效率不足等缺点,针对这一问题,人们提出了并行支持向量机的解决方法。本文以此为研究背景,展开了对并行支持向量机的相关研究工作。本文详细探讨了并行支持向量机的相关理论,从支持向量机和并行技术两方面入手,对并行支持向量机的理论基础和技术支持进行了深入研究。支持向量机是并行支持向量机的理论基础,在简要介绍了其发展历程之后,对其理论依据和实现算法都进行了深入研究。并行技术是并行支持向量机的技术支持,主要介绍了其软硬件的发展历程及目前的关键技术,着重介绍了计算机集群系统。计算机集群系统以其良好的编程性、低廉的价格和极高的性能成为目前并行机的一个主流发展方向,因其特别适合我国的教育、科研部门的需求,故在集群系统上进行的并行支持向量机的研究具有重要的实际意义和很好的推广价值。本文介绍了目前并行支持向量机的发展情况,对其基本模型和改进算法都进行了深入研究。在这一部分,着重介绍了w-model和Cascade SVM两种实现并行支持向量机的设计模型,并分析了两者各自的优缺点。在这两个模型的启发下,借鉴两者的优点并加以结合,提出了适合在并行环境上应用的支持向量机求解方法。该方法首先并行生成多个支持向量机分类器,然后采用遗传算法的思想对最终解进行搜索。本文详细论述了所提出算法的解决思路及其数据结构的设计,对遗传算法在本问题的应用中,其选择、交叉和变异等遗传操作的具体设计实现进行了详细描述。最后,在由DNA序列生成的生物数据集上,对Cascade SVM和GA-PSVM进行了测试,给出实验结果并对实验结果进行深入分析得出了相关结论。关于GA-PSVM的实验结果表明,应用遗传算法的并行支持向量机算法既保证了原始问题的正确率,又大大缩短了运行时间。但是随着测试数据维度的增加,并行算法加速比有所下降,本算法在适应度函数的设计上,还有待于进一步完善。

其他文献

QR二维条码自动识别系统的研究与实现

本文首先以QR二维条码为例，探讨了二维条码图像的定位与分割算法，利用Radon变换与Sobel边缘检测算法将条码图像从原始条码图像中有效地分割出来；然后分析了经过光学系统的条码图

学位

条码图像自动识别Fourier变换QR二维条码

无线传感器网络MAC层协议的研究

集成了传感器、微机电系统和网络三大技术而形成的传感器网络是一种全新的信息获取和处理技术。随机分布的大量传感器节点，以无线自组织的方式构成网络，通过节点中内置的各种类

学位

无线传感器网络MAC层协议媒体接入控制退避算法二进制指数退避

基于需求追踪的Web应用测试脚本修复和版本控制技术研究

当前,大量的Web应用都采取了快速迭代的开发方式,产品需求时常发生改变,产品的前台界面和后台业务逻辑通常也会随之改变。因此,需要进行大量严格的回归测试,验证功能是否能完

学位

自动化测试界面演化需求追踪性测试脚本修复版本控制

TD-SCDMA系统联合检测算法的研究与实现

由于采用了联合检测、智能天线等关键技术，TD-SCDMA 系统相对于WCDMA 和 CDMA2000 具有最好的频谱利用率，因此 TD-SCDMA 的相应关键技术是现在各个公司研究的重点。其中联合检

学位

移动通信TD-SCDMA信道估计干扰消除

基于数据挖掘的视频关键帧的提取

随着多媒体技术的快速发展，视频数据大量地增加，基于内容的视频检索的应用越来越广泛，而关键帧提取技术是视频分析和基于内容的视频检索的基础。一个镜头的关键帧就是反映该镜头

学位

视频检索数据挖掘视频关键帧运动信息数据处理

基于椭圆曲线密码支付系统研究和实现

随着电子商务的发展，电子支付安全问题已成为人们日益关注的热点。常用的电子支付的协议有SSL协议和SET协议。基于SSL协议的电子支付系统成本低、应用简单透明、相对简单且快

学位

椭圆曲线密码点乘运算ECDLPECDSAECDHSET协议

面向学术文献检索的P2P网络研究

Google Scholar为我们搜索各种来源的学术文献信息提供了一个简单易用的平台。它使用网络爬虫来把各种来源的文献信息集中存储到Google自己的数据库里，然后通过web向用户提供

学位

学术文献检索P2P网络网络爬虫元数据标准缓冲查询请求缓冲算法

基于生物信息学应用的混合架构集群系统研究

自从全基因组测序成为可能以来,基因组结构注释(包括了解基因组DNA中的基因组成、结构及其调控元件)成为生物信息学研究的重要问题,由于基因组结构注释系统的计算量庞大,需要

学位

生物信息学集群并行计算

数据挖掘在生物信息处理中的应用植物miRNAs的聚类与预测算法分析

当前核酸、蛋白质数据呈几何级数增长，如何从海量数据中获取有效信息成为生物信息学迫切需要解决的问题。数据挖掘技术就是从大量的数据中挖掘出有用的或者人们感兴趣的知识的

学位

聚类分析miRNAs关联规则数据挖掘生物信息处理预测算法

词间相关性对文本分类的影响

随着互联网技术的发展，存储于Web里的信息急剧膨胀，这些信息包括文本信息、声音信息、图像信息等，其中文本信息存储和传输技术相对比较简单，易于上传和下载，因此大部分信息以文本

学位

文本分类词间相关性朴素贝叶斯贝叶斯网络2-P贝叶斯

并行支持向量机的研究与实现

其他学术论文