基于异构平台的航空冰雷达现场处理算法优化加速的研究与实现

来源 :北京工业大学 | 被引量 : 0次 | 上传用户:ibm__1235
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
2018-2019年,本人有幸成为第35次中国南极科学考察成员,参与完成了“雪鹰601”航空观测平台的现场数据处理工作。航空冰雷达数据处理是现场工作中极其重要的一个环节之一。航空观测所采集的冰雷达数据覆盖范围广、处理流程复杂。然而,我国所采用的航空冰雷达处理方法是基于中央处理器(central processing unit,CPU)进行实现的。这使得冰雷达数据处理耗时较长,极大地限制了现场数据分析的效率,进而影响后续航空观测任务的开展。通过深入调研发现,在冰雷达处理算法中,部分处理步骤可以满足并行化的优化条件,因此可以考虑借助高效的并行化处理平台提升处理效率。在众多并行化数据处理平台中,图形处理器(Graphics Processing Unit,GPU)虽然最初被应用于图像和图形领域,但因其卓越并行化计算性能而被众多通用计算领域的研究人员广泛应用。在处理器从多核时代向异构时代迈进的过程中,英伟达(NVIDIA)公司开创性地提出了统一计算设备架构编程模型(Compute Unified Device Architecture,CUDA),使得编程人员可以更为便捷、充分地利用GPU的计算性能,提升并行计算效率。鉴于上述原因,本文将从分析航空冰雷达算法特点入手,基于CUDA编程框架,通过优化算法结构、增进算法并行度、提升I/O数据传输效率等一系列方法,设计并实现了航空冰雷达算法的优化加速方案。本文主要内容可以概括为以下四个方面:1.以CUDA与航空冰雷达算法为研究主线,介绍了CUDA线程模型与微架构模型,对CUDA架构进行了深入研究。随后,结合CUDA的架构特点对航空冰雷达算法的并行性进行理论分析,并通过分析现有优化平台下的实验结果,发现了影响优化程序效率的性能瓶颈,为后续的优化方法奠定了良好的理论基础。2.为了解决现有处理算法处理流程较为复杂导致并发性不足的问题,我们通过分析航空冰雷达算法处理维度,结合GPU自身架构特点,针对航空冰雷达的距离向与方位向处理步骤分别使用重叠操作、循环展开的指令级优化方法。3.为了解决大数据量航空冰雷达数据导致的GPU处理过程传输效率问题,使用流隐藏CPU-GPU间数据传输延迟;再通过分析航空冰雷达处理算法的空间局部性,结合GPU缓存命中机制,以提高GPU缓存命中率为目的进行循环调整,可以有效提高方位向处理步骤的空间局部性。4.根据航空冰雷达现场分析的需要,提出了一种快速提取南极航空冰雷达数据中冰面与基岩界面的方法。结合上述优化方法,提出了一套基于优化与分析方法的实现方案。最后,给出相关优化结果与最优资源配置方案,实现了一整套服务于现场数据处理、分析的应用程序,对于我国南极航空地球物理调查的开展具有重要意义。
其他文献
企业能否对销售费用进行有效管控,关系着企业的发展前途。严格的销售费用管控措施能极大程度上有力保障企业目标利润的实现,同时也是企业实施目标战略的重要工具,它为企业创造着不容忽视的价值。作为医药零售行业,销售费用是YF医药零售企业费用支出的主要组成部分,对销售费用的有效管控,能对公司的经济效益产生立竿见影的效果。销售费用管控主要是通过各个环节严谨细致的内控及激励工作得以实现,在严格的费用管控中,销售费
随着土地资源越来越紧张以及城市化进程的推进,越来越多经济发达的沿海城市开始填海造地修路建房,但是随之而来的是滨海区域软土的工后沉降造成的问题频见报道。我国软土广泛
本论文针对镍锌电池充放电循环过程中,存在的锌电极变形和锌枝晶形成对电极结构的影响问题,提出利用具有羟基和氨基基团的螯合锌,负载到经处理后富含含氧基团的石墨毡载体上,利用锌活性材料与石墨毡纤维的极性基团相互作用,增强锌材料在载体的吸附强度,石墨毡具有柔性,可解决锌电极变形问题,并且纤维取向诱导锌枝晶的生长取向,三维空间结构容纳锌枝晶的生长,提高镍锌电池的性能。通过电化学三电极体系,比较了氧化锌、甘氨
随着经济全球化的发展,各国之间的联系日趋紧密。翻译作为各国文化交流的途径之一,扮演着越来越重要的角色。由于各国在社会、历史、文化和语言等方面存在诸多差异,一国语言经由翻译产生的翻译损失也成为翻译过程中不可避免的问题。这就要求译者须运用一些翻译策略将损失降低,而补偿就是其中重要的策略之一。翻译补偿策略是确保译作较完整地传达原文的信息、意义以及文化因素等要素的必要策略[27]。从20世纪80年代后期起
21世纪以来,作为经典微积分的推广,分数阶微积分在复杂粘弹性材料、系统控制、生物医学工程、高能物理及经济学等众多领域得到了广泛的应用,引起了国内外学者们的研究热潮.由于分数阶微积分具有“非局部性”、“记忆性”及“遗传性”的独特优势,将其引入神经网络系统以描述神经元的认知、决策、自适应等特性具有重要的现实意义和研究价值.因此,本文将综合运用分数阶微积分理论、神经网络系统理论、复变函数理论及系统控制论
天山北路军台始设于康熙,继之于雍正,大成于乾隆。清廷设置军台的初衷是为了捍卫国家统一。路径直捷、关隘要区、水草丰茂是影响军台选址及交通走向的重要因素。乾隆十九年(1754)至乾隆三十二年(1767),天山北路军台整体呈现出“设置——破坏——再设置”的特点。在此期间,该地区形成了巴里坤至伊犁的军台主干道交通线,并以该主干道交通线为核心轴线,向南北两侧发散五条干道交通线。乾隆时期清廷在天山北路所设军台
滚动轴承的监测与诊断对保障机电设备稳定运行,减少停机和避免重大经济损失意义重大。轴承信号是非稳态信号,且受噪声干扰,针对轴承早期故障诊断的难题,本文研究了奇异谱分解方法的原理,研究了基于奇异谱分解与包络谱、最小熵解卷积等结合的轴承诊断方法,最后通过实验信号进行了验证。本文主要内容如下:1、研究了奇异谱分解方法的相关理论和分解效果进行介绍和仿真分析,其主要内容包括:介绍了奇异谱分解方法的理论,研究了
目的:回顾性分析广东省中医院CKD5期非透析患者发生肾脏替代治疗事件的危险因素,初步探讨含大黄复方治疗对于患者预后的影响,为临床实践提供参考。方法:应用广东省中医院电子病历数据收集从2009年10月至2019年12月所有符合入选标准的住院及门诊病例,并从中提取随访资料。分析基线资料、比较基线资料组间差异,使用cox回归模型分析影响疾病进展的风险因素,将病例分组,探讨中药对湿热证候病例的影响作用。结
粒形作为水稻产量和品质的重要组成部分,一直备受研究者们的关注。作为一个数量性状,粒形受许多QTLs调控。这些QTLs编码的蛋白主要涉及的调控通路有蛋白酶体降解途径、G蛋白
卟啉及其衍生物是具有研究前景的气敏材料,近年来,为了更好的发挥它们的气敏性能,卟啉-金属氧化物杂化材料引起了国内外研究者的兴趣。本文选择配位能力较强的5、10、15、20-(四-4-氨基苯基)卟啉(TAPP)作主要气敏材料,同时合成了SnO_2和CeO_2纳米颗粒,并将金属氧化物(SnO_2,CeO_2)与5、10、15、20-(四-4-氨基苯基)卟啉进行复合,制备了光波导气敏元件,测试了气敏性能