CPU/GPU异构集群并行计算模型研究

被引量 : 0次 | 上传用户:liongliong602
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
国民经济和科学技术的快速发展对高性能计算机的性能提出了更高的要求,采用通用CPU研制高性能计算机的传统方法,在能耗、散热、成本等方面遇到了重大的挑战。异构体系结构结合了通用处理器和加速处理器两者的优势,逐渐成为高性能计算机领域的主流体系结构。GPU以其强大的运算能力、高存储带宽、低功耗以及较好的可编程性,在异构计算机系统设计中确立了主导地位。在绿色高性能计算时代,CPU/GPU异构系统是一种非常有发展前景的并行计算机类型。大型CPU/GPU异构系统强大的计算能力为大规模科学和工程计算提供了很好的机遇,然而其复杂的硬件结构和独特的程序执行特点又给众多高性能计算研究人员提出了巨大的难题。作为并行计算的一个分支,并行计算模型是对底层并行计算机系统的抽象,其用少量参数反映并行计算机系统的资源和性能特征,是联系并行编程模型与底层并行计算机系统的纽带,对算法设计者意义重大。并行计算模型一般具有通用性,然而,对于新兴的CPU/GPU异构高性能计算系统,由于包含了三个层次的异构特点,现有相关模型已无法准确描述其结构特点和性能影响因素,因此迫切需要针对该类高性能计算系统开展并行计算模型研究,从而为当前以及未来基于该类平台的并行应用开发提供支持。因此研究关于CPU/GPU异构集群的并行计算模型意义十分重大。本文主要完成的工作有:1)系统地综述并行计算模型的相关工作。在深入分析并行计算机体系结构特点及其发展趋势的基础上,概括了国内外有关并行计算模型的研究进展,并对各种模型进行了对比分析。2)提出了面向大型CPU/GPU异构高性能计算系统的并行计算模型,用来抽象该类系统的计算能力和各种通信行为。在分析新模型复杂度的基础上,将其完全映射到TH-1A系统上,并测定出所有模型参数。3)使用CUDA实现NPB-IS、NPB-FT基准程序,并将它们有效移植到TH-1A平台。借助通信密集型应用NPB-IS和计算密集型应用NPB-FT程序,对新模型进行了验证。4)实现了对典型科学应用程序的优化。使用gprof工具找出NPB-IS和NPB-FT的计算和通信瓶颈,然后采用CPU/GPU异构集群编程优化方法对NPB-IS、NPB-FT的计算和通信进行了优化,并对优化结果进行了详细比较和分析。
其他文献
幼儿教师专业发展自我评价强调教师的评价主体地位,要求教师应主动将自己专业发展情况进行自我分析、自我反思。它是提高幼儿教师专业水平的重要手段,是有效推动幼儿教师专业发
高光谱遥感是当前遥感技术发展的一个前沿领域,它利用很多很窄的电磁波波段从感兴趣的物体获得有用信息。高光谱图像作为遥感领域的一项重大突破,在保留较高空间分辨率同时,其光
本研究主要以文化印迹为视角来系统探讨它在城市公共空间复兴中的价值、功能、元素构成、基本原则、具体方法等问题。本研究以界定城市公共空间的概念为起点,在此基础上探讨文
香菇栽培过程中,往往在子实体分化、大小菇蕾出现时,常发生烂菇现象。其原因:多是长菇期间连续降雨,特别是春季温暖潮湿的情况下,如菇床湿度过大,易使杂菌侵入为害,造成烂菇
中国科学院上海应用物理研究所概念设计了2MW的熔盐实验堆,本文利用根据点堆模型建立的中子动力学模块,和根据简化的集中参数传热模型建立的传热模块,基于MATLAB/Simulink,对2MW
本文是在广东省“简政强镇”改革的背景下,以2008年至今佛山市检察机关镇(街)检察室的工作模式和实际情况为调研对象,结合我国乡镇检察室的发展历史、作用及局限性,深入分析我国构
城市生活垃圾已成为当前世界性公害之一,是城市环境建设的一大难题。垃圾科学处理实现减量化、无公害化、资源化已成为世界各国各类城市当前的一项社会发展战略任务。一些国
股市跌、跌、跌;监管严、严、严;大佬慌、慌、慌,资本市场一片狼藉,曾经的财富神话,转瞬如风。“吊诡”的市场不按常理出牌;“任性”的监管不看风云变幻;股价的阴跌“绵绵”,让曾经风
听课评课是中小学开展学科教研活动的常见形式。各级教研管理部门和各类学校教务部门都热衷于开展听评课活动,可是很多中小学一线教师却不喜欢开课,也不乐于参加听评课活动。可
报纸
目的 探讨温肾活血方治疗肾阳虚血瘀证血管性痴呆的临床疗效。方法 本研究所选对象为肾阳虚血瘀证患者80例,按照随机方式将全部患者分成两组,选择奥拉西坦胶囊治疗40例对照组