【摘 要】
:
电大目标电磁散射分析是计算电磁学中的一个重要方向,其主要特征是未知量数目大,计算时间长,硬件资源要求高。为了快速求解目标散射特性,通常在大规模计算机集群系统,多核CPU
论文部分内容阅读
电大目标电磁散射分析是计算电磁学中的一个重要方向,其主要特征是未知量数目大,计算时间长,硬件资源要求高。为了快速求解目标散射特性,通常在大规模计算机集群系统,多核CPU的高性能服务器平台上应用MPI, OPENMP编程技术实现并行快速求解。近几年里,一种单机平台上的并行计算技术——基于图形处理单元GPU的CUDA编程模型问世推广并被成功应用,本文采用基于GPU的CUDA编程模型在单机平台上实现了电磁散射问题积分方程方法求解的并行计算。本文为继承性工作,具体内容为实现在GPU平台上并行处理基于积分方程方法的矩量法和多层快速多极子方法。已完成矩量法在GPU平台上140倍左右的加速比,多层快速多极子方法在GPU平台上7倍左右的加速比。不足之处是在当前平台上矩量法能计算的未知量数目只有不到一万,多层快速多极子方法的加速比很低。在此背景下,在仔细阅读程序,充分理解程序,测试各部分代码运行效率之后,针对上述不足之处提出了改进方案:对于矩量法,由原来阻抗矩阵等数据全部存放在显存中改为存放在主机内存中,然后把计算时需要的数据分批依次读入显存,在小型工作站上实现了可计算的未知量明显提高,但加速比略有下降;对于多层快速多极子方法,在多极聚合步骤中,由原来各个线程从显存读取所需数据改为从共享内存读取所需数据,减少了线程直接从显存读取数据的次数,且提高了线程读取数据的速度,代价是在共享内存中有一定比例的冗余数据,在多极配置步骤中,由原来的角谱点串行展开改为把角谱点分组使得每组内的角谱点的展开谱不重叠,然后每一组的角谱点并行展开,经过优化,在当前平台上实现了多层快速多极子方法由原来的7倍加速比变为现在的14倍加速比。
其他文献
管理层收购(MBO)作为一种新型的并购形式,在80年代曾风靡欧美。90年代以来随着公司结构和法人治理领域的深度变革和巨大变化,MBO呈现出全球化的趋势。在中国,随着国有资本战
目的:高氧在新生儿救治中有重要作用,长时问吸入高氧可引起的肺纤维化及支气管肺发育不良(BPD),已引起广泛重视。目前高氧肺纤维化损伤的发病机制尚不清楚。转化生长因子-β1(TGF-
实行建设监理制度是我国建设领域的一项重大改革,是我国改革开放、利用外资、国际交往日益扩大的结果。文章通过对监理工作中一些现状的分析,提出当前监理工作的任务,以便引
随着激光技术的兴起和发展,由于激光微加工技术具有作用时间短、热影响区域小、加工精度高且易于控制等传统加工技术所无法比拟的优点,受到越来越多的关注。为了研究激光与物
集成技术的快速发展推动了数字系统设计技术的发展。现有的数字信号处理系统设计大多基于DSP或专用ASIC芯片方案,存在以下这些问题,比如:高速性能不好,升级配置不灵活,给工程
纳米材料具有许多传统材料无法媲美的奇异特性和特殊功能,在各行各业中将有空前的应用前景。二氧化锆是一种过渡金属氧化物,有单斜、四方、立方三种晶型,由于在电子陶瓷材料
研究背景及目的 蛋白质酪氨酸残基的可逆磷酸化是正常生命活动和疾病转归中的关键机制,其磷酸化水平受酪氨酸激酶(PTKs)和酪氨酸磷酸酶(PTPs)的共同调节。由于许多PTKs是癌
故障树分析法是概率安全分析的一个重要方法,广泛应用于航空、航天、核能、电子、化工等众多领域,被公认为是一种简单、有效、最有发展前途的分析方法。故障树模型是故障树分析
在粮食储藏过程中,储粮害虫不仅造成相当数额的粮食损失,而且也是直接影响粮食品质的重要因素之一。储粮害虫防治对人类的生产生活具有重大的经济意义。目前,对于储粮害虫的
基于2002年中国省区间投入产出模型,从产业内贸易角度重新审视产业结构同构问题。研究表明,中国制造业存在着一定的产业结构同构现象,但空间上不均衡。华东沿海地区存在着大