论文部分内容阅读
“遥感”是使用从卫星或飞机发射到地面的电磁波(包括光波)的传播和接收来检测和分类地球上物体的基本方法。近年来,遥感技术发展非常迅速,同时地球观测的时间和空间分辨率也在不断提高。遥感数据将呈现典型的“大数据”问题,对于当前的高性能计算(HPC)系统以及相应的解决方案无疑将是一项艰巨的挑战。因此,迫切需要研究能够有效处理遥感数据的新颖的解决方案。另一方面,近十年来深度学习以极快的速度发展,并且已经成为“大数据时代”中最有前途的方法之一,尤其是以卷积神经网络为代表的计算机视觉技术的蓬勃发展对遥感影像分析研究带来巨大推动,在遥感目标识别及提取等问题上展现了巨大的潜力,然后在在研究区域尺度、多源数据融合、模型准确率等方面依然存在局限。此外,由于神经网络架构越来越复杂,需要足够算力的硬件平台支持,而传统的CPU由于冯诺依曼架构瓶颈,其所具备的计算性能已经无法满足算法所需的高性能计算需求,而高性能GPU由于其高功耗的特点,无法在嵌入式端大规模使用。针对上述问题,本研究以高效化、智能化地理解遥感影像中的结构化信息为目标,首先以深度学习为主要方法,在数据集构建、方法模型设计等方面进行了改进和创新。其次,基于高性能异构平台FPGA(Field-Programmable Gate Array),构建高效卷积计算核心,以提高系统性能。本文首先基于目标检测深度学习模型的油棕榈树识别方法,将深度学习应用于卫星影像树木识别问题,在数据层面建立了基于Quick Bird卫星影像的油棕识别数据集,在方法层面上基于改进端到端深度学习目标检测模型YOLOv3,采用扩大特征选择、加大多尺度特征融合的优化策略,提高了算法对高分辨率的棕榈树的检测准确度,本研究在位于马来西亚的面积约55平方千米的区域上取得最高94.53%的整体准确率,与已有的树木识别方法相比提高了7%-16%,显著减少了油棕和其他植被之间的混淆。其次分析深度学习算法原理,针对卷积神经网络的复杂度和并行性进行了分析。基于高性能异构平台,通过部署与实际算法相对应的长并行单元流来实现高并行性。采用权重整形8位量化和计算核心复用的优化策略,设计了一个基于SIMD的高效卷积计算引擎。此外,对输入模块进行了加速改进,通过对输入图片进行维度变化、向量化处理后,以写队列的方式传送给输入模块,提高了总线带宽的利用率。实验表明,在基于Intel Arria 10的异构硬件平台上可以获得1.4TOPS/s的性能,与i9-9980XE CPU相比,性能是它的7.51倍,能效是其33.02倍,与NVIDIA推理端专用加速器P40比,能效是其1.2倍。