并行支持向量机的研究与实现

来源 :北京工业大学 | 被引量 : 0次 | 上传用户:wgxwjl
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
支持向量机是在统计学习理论的基础上发展起来的新一代学习算法,该算法在机器学习、模式识别等领域都取得了很好的应用。但随着需要处理的数据量不断增大,支持向量机表现出计算效率不足等缺点,针对这一问题,人们提出了并行支持向量机的解决方法。本文以此为研究背景,展开了对并行支持向量机的相关研究工作。 本文详细探讨了并行支持向量机的相关理论,从支持向量机和并行技术两方面入手,对并行支持向量机的理论基础和技术支持进行了深入研究。支持向量机是并行支持向量机的理论基础,在简要介绍了其发展历程之后,对其理论依据和实现算法都进行了深入研究。并行技术是并行支持向量机的技术支持,主要介绍了其软硬件的发展历程及目前的关键技术,着重介绍了计算机集群系统。计算机集群系统以其良好的编程性、低廉的价格和极高的性能成为目前并行机的一个主流发展方向,因其特别适合我国的教育、科研部门的需求,故在集群系统上进行的并行支持向量机的研究具有重要的实际意义和很好的推广价值。 本文介绍了目前并行支持向量机的发展情况,对其基本模型和改进算法都进行了深入研究。在这一部分,着重介绍了w-model和Cascade SVM两种实现并行支持向量机的设计模型,并分析了两者各自的优缺点。在这两个模型的启发下,借鉴两者的优点并加以结合,提出了适合在并行环境上应用的支持向量机求解方法。该方法首先并行生成多个支持向量机分类器,然后采用遗传算法的思想对最终解进行搜索。本文详细论述了所提出算法的解决思路及其数据结构的设计,对遗传算法在本问题的应用中,其选择、交叉和变异等遗传操作的具体设计实现进行了详细描述。 最后,在由DNA序列生成的生物数据集上,对Cascade SVM和GA-PSVM进行了测试,给出实验结果并对实验结果进行深入分析得出了相关结论。关于GA-PSVM的实验结果表明,应用遗传算法的并行支持向量机算法既保证了原始问题的正确率,又大大缩短了运行时间。但是随着测试数据维度的增加,并行算法加速比有所下降,本算法在适应度函数的设计上,还有待于进一步完善。
其他文献
本文首先以QR二维条码为例,探讨了二维条码图像的定位与分割算法,利用Radon变换与Sobel边缘检测算法将条码图像从原始条码图像中有效地分割出来;然后分析了经过光学系统的条码图
集成了传感器、微机电系统和网络三大技术而形成的传感器网络是一种全新的信息获取和处理技术。随机分布的大量传感器节点,以无线自组织的方式构成网络,通过节点中内置的各种类
当前,大量的Web应用都采取了快速迭代的开发方式,产品需求时常发生改变,产品的前台界面和后台业务逻辑通常也会随之改变。因此,需要进行大量严格的回归测试,验证功能是否能完
由于采用了联合检测、智能天线等关键技术,TD-SCDMA 系统相对于WCDMA 和 CDMA2000 具有最好的频谱利用率,因此 TD-SCDMA 的相应关键技术是现在各个公司研究的重点。其中联合检
随着多媒体技术的快速发展,视频数据大量地增加,基于内容的视频检索的应用越来越广泛,而关键帧提取技术是视频分析和基于内容的视频检索的基础。一个镜头的关键帧就是反映该镜头
随着电子商务的发展,电子支付安全问题已成为人们日益关注的热点。常用的电子支付的协议有SSL协议和SET协议。基于SSL协议的电子支付系统成本低、应用简单透明、相对简单且快
Google Scholar为我们搜索各种来源的学术文献信息提供了一个简单易用的平台。它使用网络爬虫来把各种来源的文献信息集中存储到Google自己的数据库里,然后通过web向用户提供
自从全基因组测序成为可能以来,基因组结构注释(包括了解基因组DNA中的基因组成、结构及其调控元件)成为生物信息学研究的重要问题,由于基因组结构注释系统的计算量庞大,需要
当前核酸、蛋白质数据呈几何级数增长,如何从海量数据中获取有效信息成为生物信息学迫切需要解决的问题。数据挖掘技术就是从大量的数据中挖掘出有用的或者人们感兴趣的知识的
随着互联网技术的发展,存储于Web里的信息急剧膨胀,这些信息包括文本信息、声音信息、图像信息等,其中文本信息存储和传输技术相对比较简单,易于上传和下载,因此大部分信息以文本