基于Spark平台的支持向量机并行化遥感图像分类算法研究

来源 :华东师范大学 | 被引量 : 0次 | 上传用户:syscom
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
各种大数据处理技术如Hadoop、Spark等已被广泛应用于遥感大数据处理;机器学习的分类方法也已大量应用于遥感图像的分类识别。针对遥感大数据,如何快速高效地利用机器学习分类算法对遥感图像进行分类是一项急需解决的问题。虽然已有基于Spark平台下MPI任务和GPU任务的调度实施研究,但其任务划分是一种二分法模式,即把任务分为MPI任务或者GPU任务,没有把GPU任务嵌入MPI进程中。为了充分利用MPI的粗粒度并行编程模型和CUDA的细粒度并行编程模型的特点,本文提出了基于Spark框架将CUDA并行嵌套在MPI多进程中,从而能够更加有效提高计算处理速度,并搭建了基于Spark框架的高性能支持向量机并行计算框架。基于提出的框架,本文改进了机器学习的支持向量机算法,实现了支持向量机分类算法在该平台下的高性能并行计算。以上海地区的Landsat8遥感影像作为实验数据,在不同实验情境下进行实验,得出如下结果:1)在单节点下,MPI-CUDA并行的遥感图像分类精度较单机串行下虽然降低了1.05%,但是其计算速度却提高了6.3倍。2)在单节点MPI-CUDA环境下,随着次进程数的增多虽然遥感图像分类精度逐渐降低,由94.64%(开启1个次进程)降至92.42%(开启10个次进程),当次进程数超过8时,支持向量机的分类精度趋于稳定。但是其计算速度却明显逐步提高,最后趋于平稳(当次进程数量超过9时)。3)随着节点数的增多,支持向量机分类算法的计算耗时逐渐降低,加速比逐渐增大,但是增长幅度是越来越低的;当节点数个数分别为2、4、6时,其对应加速比为1.62、2.34、2.65。虽然本文提出的框架会造成遥感图像分类精度的轻微降低,但通过综合分析不同环境下的支持向量机分类精度以及分类时效,证明了本文提出的基于Spark平台的高性能并行计算框架是可行且可靠的,将CUDA并行嵌套在MPI多进程中是一种高效的混合并行模式。
其他文献
<正>企业和应聘者处于一个信息平等的地位,这种对潜在员工的平等、诚实和公开的信息互动,将促进企业与员工之间互信互利的良好的劳资关系,降低离职率,提高人职匹配。企业和应
"小数教"是高师院校培养小学数学教师的重要专业课程,但在课程实施过程中存在着教学内容陈旧、能力培养不足、评价手段单一等问题.通过优选教学内容、改进教与学的方式、加强
<正> 无知的年代战争的地位从来没有象二十世纪最初十五年那么高。不仅国务活动家们把武装冲突看作解决主权国家争端的完全合法的手段,而且到处呈现出持枪舞刀跃跃欲试的姿态
<正>一、背景介绍(一)本校研究情况。以计算机为核心的信息技术与学科的教学加以有机的整合,可以具有优化教育、教学过程的多种宝贵的特性。根据目前中心小学计算机的配备情
白蜡树属双子叶植物纲,木犀科白蜡树属。白蜡树树种形体端正,树干通直,枝叶繁茂而鲜绿,秋叶橙黄,是优良的行道树和遮荫树。本文对比天津滨海地区两次白蜡秋季裸根移植施工措
在工程中,往往要对一平面内的运动位置,包括直线位移和角位移进行测量和控制。本文对常用的测控技术和方法做了比较全面的简介。并结合实例从软硬件方面详细讨论了利用光电开
命题作文是根据题目的要求来写作,写作之前必须真正理解题目的意思,把握题目的要求。这不仅关系到写出的文章是否切题,也关系到整篇文章的行文结构。
2017年1月120日在成都地区分昼夜对PM2.5进行连续膜样品采集,并在实验室测定了其主要化学组分(水溶性离子和碳质组分)的质量浓度.观测期间,PM2.5的平均质量浓度为(127.1±59.9)μ
支持向量机的次梯度投影算法是解决支持向量机优化求解问题的一种简单有效的迭代算法。该算法通过梯度下降和投影两个步骤的多轮迭代,找到两类最大间隔的分类面。针对该算法忽
传统水稻种业大省四川省正面临新的国际国内形势,即外部种业巨头的挑战及内部的恶性竞争。本文通过综合分析四川省水稻种业自身的优势、劣势、威胁与机遇,提出了提高四川省水