面向共享存储结构的并行编译优化技术研究

来源 :解放军信息工程大学 | 被引量 : 4次 | 上传用户:Engineer7002
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在计算机体系结构的发展过程中,并行结构的出现与不断发展将高性能计算机系统的峰值速度一次又一次推向新的高峰。但与硬件的峰值性能相比,用户程序所能获得的持续性能相去甚远,其中一个主要原因是并行程序设计带来的挑战。程序的自动并行化是实现并行程序设计的一条有效途径,编译器通过对串行程序中蕴含并行性的分析与发掘,自动生成适合并行体系结构运行的并行程序。自动并行化编译技术对于继承现有的软件财富,促进高性能计算机的应用具有重要作用。共享存储结构在高性能计算机体系结构中占据着重要地位,面向共享存储结构的并行化编译技术经过几十年的发展,已较为成熟。但是,要实现共享存储平台上高效并行代码的自动生成,仍面临若干技术挑战,如:存在跨迭代依赖循环的有效并行;自动并行化过程中程序并行收益的精确评估;异构平台上多层次存储系统的有效使用。本文以并行编译器SW-VEC的研发为背景,探讨了面向共享存储结构的并行编译优化技术,主要贡献和创新包括:1、提出了一种基于OpenMP的规则DOACROSS循环流水并行代码自动生成和流水粒度优化算法,设计实现了计算划分层和循环分块层的启发式选择算法,有效提高了规则DOACROSS循环的自动并行性能。2、提出了一种基于OpenMP的PS-DSWP自动并行改进算法,以基本块而非指令作为构建程序依赖图的基本单位,增大了并行的粒度;使用OpenMP应用编程接口实现并行时线程之间的任务分配和数据共享,有效实现了PS-DSWP算法的应用扩展和目标代码的性能提升。3、建立了一种新型的OpenMP代价分析模型,采用模块化和层次化的策略,将模型分为循环执行模型和硬件模型两个层次,既能灵活地实现模型扩展,又便于移植和运用于不同的目标体系结构。4、提出了一种基于多面体模型和精确数组区域表示的数据传输优化方法,设计了一组实现异构平台上数据传输控制的OpenMP扩展子句,定义了分块规则数组区域及其合并操作实现数组区域的精确表示,提升了异构平台中多层次存储系统的使用效率。本文提出的算法和模型已在并行编译器SW-VEC中得到了实现和应用,验证了算法的正确性和高效性。
其他文献
计算机视觉的基本目标之一是景物对象的识别,即判断两幅图像是否是同一景物对象的不同视图,对象识别面临的主要困难是同一景物对象的不同视图的观测值之间发生了改变,解决这
本文介绍了县域内农村中学教研工作一体化改革的一些具体作法
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
卡套式管接头是一种新型实用的快速管接件,它的应用和推广,取决于其良好的密封性能及反复使用功能,本文根据福州市仪器阀门厂多年来在卡套式管件进行的不断试验结果,采用了连
期刊
为了培养面向航空产业的计算机人才,使学生具备解决机载系统领域的计算机软件和硬件方面的问题的能力,本文将航空领域知识与计算机专业知识有机结合,采用跨学科的方法对机载
<正> 我院于1972年设计制造了卡套式管件,在全院中、小型实验装置上陆续使用,使用的尺寸范围为外径8~27毫米。多年使用表明,卡套式管件还存在一定局限,如在强腐蚀、高温条件下
随着蛋白质组学研究的不断细化和深入,亚细胞水平的蛋白质组成为当前蛋白组学研究的热点之一。亚细胞蛋白质组学研究可以减少全细胞蛋白组分析的复杂性,其研究内容主要包括亚
【正】 发展经济学关于经济“不发展”的标志通常是按人均的国民收入和资本积累率低于欧美人均数来解释的。其主要代表人物声称,发展经济学的任务是研究发展中国家经济落后和