扰动重力场快速(并行)计算方法研究

来源 :解放军信息工程大学 | 被引量 : 6次 | 上传用户:kobiko
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着多源重力观测数据的急剧增加,在更高时空分辨率水平上描述重力场精细结构、从全球视角分析重力场参数的时空分布已成为必然趋势。目前,重力场数据处理技术与重力场观测技术的发展还不相适应,并行计算技术在重力场研究中的应用还不够深入。基于此,本文以扰动引力的计算为例,分析了几种扰动重力场参数计算方法中内在的并行性,在不同的硬件条件下,尤其是以CPU+GPU为代表的异构环境下进行了并行化处理,使之适应更大规模数据处理的要求。本文的主要研究内容包括:1.针对构建点质量模型时遇到的大型线性方程组解算效率低的问题,分析了重力异常与点质量的相关性,提出了基于窗口控制的残差点质量模型解算方案。该方案以逐级残差的形式将重力异常的相关性控制在一定的范围内,将点质量模型的求解由原来的稠密线性方程转化为稀疏线性方程,对系数矩阵压缩存储可显著减少数据存储量。在Intel Parallel Studio环境下调用MKL并行计算库中的稀疏线性方程求解器,在普通电脑上即可完成112896阶稀疏线性方程的解算,有效扩大了点质量的整体解算范围,提高了解算效率,在多核处理器上调用MKL并行计算库可使计算效率进一步提高。2.针对高阶重力场模型计算重力场参数效率低下的问题,设计了GPU环境下基于CUDA的并行计算方案(该方法对其它重力场参数的计算同样适用)。用位系数模型计算扰动引力可分为两部分:Legendre函数及其导数的计算;球谐函数的计算。前者只能通过串行计算的方式完成,而后者在计算时具有丰富的并行性。将球谐函数的计算转化为一维向量的点乘和点积运算,并在GPU上调用相应的库函数即可极大提高效率,随着计算阶次的增大,并行计算的优势将会越来越明显。与现有的快速计算方法相比,该方案能效比较高,只需一块GPU显卡即可获得很高的加速比。3.为了尽可能大地发挥硬件的计算性能,本文结合GPU的体系结构特性对模型扰动引力的并行计算方案进行了优化设计。主要包括线程的合理分配与利用、CPU与GPU间数据传输优化、优化访存效率、移除条件分支、减少串行程序的计算时间等。针对超高阶Legendre函数递推效率低下的问题,将递推过程中与经纬度无关的元素提前计算好以便反复调用,这样极大地降低了串行部分对并行计算效率的影响;通过移除条件分支,将Legendre函数一阶导数的计算移植到GPU上执行,不仅提高了计算效率,而且减少了数组向设备端传递的耗时。实验结果表明,通过以上优化可进一步提高并行效率,在低端消费级显卡设备上,计算阶次大于1080阶时,整体计算性能提高了5倍以上,在Tesla K80专业计算显卡上则至少能提高10倍。4.设计了GPU环境下基于1D-FFT技术的全球模型扰动引力并行计算方案。该方案将球谐函数的计算移植在GPU上,计算阶次为2160阶时,在低端消费级显卡和专业计算显卡上的加速比分别达到了3倍和5倍以上。针对极点处计算扰动引力水平分量时的奇异性问题,结合已有研究成果,给出了去奇异公式。5.首次在GPU上实现了基于1D-FFT的Stokes全球积分法并行计算扰动重力场参数。全球积分法最大的障碍就是Stokes核函数计算量非常大,但将其并行化处理后这个问题很快迎刃而解,实验结果表明,计算全球5′×5′扰动引力三分量时,在专业计算显卡上只需不到2分钟即可完成,而串行程序则需半小时左右;若将分辨率提高到2′×2′时,串行算法需12小时左右,而并行算法仅需20分钟即可完成,计算效率提高了30倍以上。为进一步提高计算效率,提出了多机、多核异构环境下的并行解算方案。该方案在节点间实现进程级并行,在节点内的多核或众核上实现线程级并行,能够充分发挥计算机系统内不同硬件的计算优势。
其他文献
电力线载波通信具有得天独厚的优势和广阔的应用市场,但是传统的电力线通信系统数据的传输信道是一个公开的信道,在信息的传输过程中容易被第三方窃取信息或篡改信息。同时,
桁架和框架作为应用广泛的结构形式,在偶然荷载作用下可能发生局部范围内主要受力构件的失效和承载力丧失,导致整体结构的连续性倒塌。因此对这类结构进行易损性分析,探究结
单点渐进成形工艺是一种新型的板料柔性成形技术,具有无需或者只需简单支撑模、能提高材料成形性能、可成形复杂形状零件等特点,特别适合小批量、多品种以及快速原型制造,能
目前大多数无线传感器网络节点都是由电池供电,由于很多情况下不能及时更换电池,网络的寿命受到了极大的限制。因此,在不影响网络功能的前提下尽可能降低节点能耗、均衡网络
本论文包括两部分内容:第一部分:吡唑是一类含两个相邻氮原子的不饱和五元环化合物。作为最重要的杂环化合物之一,吡唑具有广泛的药理活性,如镇痛,降血糖,抗炎,退烧等,因此在
随着RTK技术的深入应用,越来越多的厂家开发了不同型号的GPS接收设备,这也就产生了设备兼容性问题。针对在实际生产作业过程中遇到的不同型号GPS数传电台不同频的这种GPS设备
在高等哺乳动物细胞内,线粒体是能量合成及物质代谢的重要细胞器。线粒体具有双层膜结构,依次分为外膜、膜间隙、内膜及基质等几部分,其内膜向内折叠而构成重要结构—嵴。线
通过对大量学者关于关节骨和关节软骨生物力学模型研究的分析,总结各种模型的优势与缺陷,结合虚拟手术系统的特点,建立符合虚拟髋关节手术系统要求的合理关节骨及关节软骨的
金属核心构件在特殊工作环境下会由于辐射损伤(Radiation Damage)而形成辐射诱导缺隙(Radiation Induced Defects),像金属材料晶体缺陷延伸的位错环(dislocation loops)和第
随着全球经济增长速度放缓,我国经济的增长速度呈下降趋势,该趋势在生产型企业中表现得尤为严重。生产型企业由于受到成本优势下降,资源消耗量大等多种因素的影响,企业的生产