基于异构集群的SVM并行计算研究

来源 :电子科技大学 | 被引量 : 2次 | 上传用户:wdyyy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
支持向量机(support vector machine,简称SVM)由于其完整的理论框架和在实际应用中取得的良好效果,特别是在多分类问题上显示其突出的能力以及作为运用核函数的成功范例,在人脸检测、时间序列预测、自适应信号处理、模式识别和图像识别等方面都得到广泛的应用。SVM训练阶段实质是求解二次规划(QP,Quadratic Programming)问题得到支持向量,求解QP问题过程中须计算出N阶矩阵(N为样本数量)。随着大数据时代的到来,在样本类别多,样本数量大、样本特征多情况下,存在计算量大,支持向量机内存使用过多,训练速度慢等问题。针对这些问题,本文就并行化SVM展开了相关工作,研究并行技术分散SVM内存依赖,加速训练过程,Lib SVM训练过程默认设置核函数Gamma参数和容错惩罚C参数,不利于提升训练精度和训练模型的泛化能力。国内外学者多基于二分类SVM采用混合编程(例如MPI+CUDA)并行加速SVM训练过程,而实际大概率需要处理多类样本,并且混合编程提升了开发者开发难度。论文主要工作如下:1.为提升分类精确度和支持向量机的模型泛化能力,基于Lib SVM增添参数优选功能。2.在有关并行化SVM的文献基础上,分析比较现有大数据编程模型优缺点,本文提出了基于分布式的异构加速并行方案。该异构集群框架扩展性好,能够实现不同计算资源(例如CPU,GPU,DSP)的增减并且不用改动程序流程;容易二次开发,不需要程序员掌握并行编程相关技术;适应多种应用场景;计算性能随计算资源近线性增长。3.为加速支持向量机的训练速度,本论文通过对支持向量机模型的研究,结合SVM串行实现,比较4种SVM并行实现方法并选中svm_train_one并行加速方案;理清代码结构,寻找训练过程中的计算热点以便于并行化;编写了CPU版本和GPU版本的svm_train_one并行加速程序并注册到集群框架。4.基于阿里云搭建实验环境,用两组样本进行性能测试。实验结果分析表明,基于异构集群的svm_train_one并行方案在支持向量机训练速度上有显著提升,具有重要的实用价值。
其他文献
酒精性肝纤维化(ALF)是以肝星状细胞(HSC)为主的细胞激活增殖,肝脏的几种效应细胞通过自/旁分泌致病/抗病因子和炎性介质相互作用,使细胞外基质(ECM)各成分合成明显增多,降解
目的探讨剖宫产术后应用中药活血止痛汤及硬膜外自控镇痛泵(PCEA)的镇痛效果及不良反应的影响。方法随机选取120例术后采用中药活血止痛汤及PCEA方法作为研究组,120例术后常
2008年全球金融危机后,欧美市场需求低迷,具有"世界工厂"头衔的中国,传统外贸出口受阻较严重,但另一种模式的中国外贸出口——跨境电子商务出口却以20%~30%的速度增长。其中
随着中国经济的发展,英语成为中国第一外语。英语学习成为一股热潮。而望子成龙的家长们,基于“早学越好”的思想,也加入了英语学习的热潮。响应这一迫切需求,社会上应运而生了许
目的:评价格列美脲联合针灸中药治疗气阴两虚型2型糖尿病患者的疗效。方法:选择2007-2009年在本院就诊的气阴两虚型2型糖尿病患者80例,随机分为对照组和观察组,对照组采用格
如何把粮食优势变为经济优势,是发展农村经济的关键所在,也是人们十分关住的焦点问题。近几年,以粮食加工业为主导产业的“龙头企业”,为粮食主产区的粮食生产开辟了一条高产
贝多芬是德国伟大的作曲家,钢琴家,同时也是维也纳古典乐派的杰出代表。他的音乐创作从形式、体裁到风格都承袭了18世纪以海顿、莫扎特为代表的古典音乐风格,而且预示或体现
<正>《当代音乐》由吉林省文学艺术界联合会主管,吉林省音乐家协会、吉林音像出版社有限责任公司主办,《当代音乐》编辑部编辑出版。国际标准刊号:ISSN1007-2233。国内统一刊
<正>去年出现了一部电影叫做《80’后》,片名颇为宏大,但无论是作为谈资还是商品,影片本身都没能在社会上形成和片名等量的影响。据说影片本来叫做《天长地久》,后来才改为《
本文结合教学实践对强调并着重优化理论知识认识过程的原则、突出体现数学思维发展的原则、培养数学应用的原则、重视数学思想方法教学的原则、优化数学结构教学的原则、注重