集成众核平台科学计算应用性能测评和优化研究

来源 :国防科学技术大学 | 被引量 : 0次 | 上传用户:goodluckxsb1223
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着处理器技术的不断发展,采用众核处理器作为加速部件已成为高性能计算领域的重要技术趋势。目前主流众核产品有通用的图形处理单元(Graphics Processing Unit,GPU)和新近推出的集成众核(Many Integrated Core,MIC),这类高性能异构众核架构虽然能够提供更高的峰值计算性能,但由于其体系结构复杂、编程困难,给应用的开发、维护和移植带来了很大的挑战。而Open CL(Open Computing Language)、Open ACC等跨平台异构并行编程模型的出现,大大简化了应用移植的难度,此类模型的代码可以不经修改就能在CPU、GPU、MIC等各个平台上运行。但其获得的性能如何,是否通过适当调整就能充分利用相应平台的硬件资源,这成了高性能计算领域关注的问题。本文面向MIC集成众核平台,采用跨平台的Open CL并行编程模型,深入研究科学计算应用在众核架构上的性能影响因素,并针对相应的问题,提出了系统的优化方法。主要的工作包括:(1)通过深入测评分析MIC架构上Open CL科学计算应用的性能,找到了影响应用性能的主要因素及其具体影响方式,其中单一因素对性能的影响差异最大达7倍以上,更进一步发现了向量化和存储访问是制约应用性能最关键的因素。(2)针对向量化,提出了两种基于Open CL向量数据类型的显式向量化优化方法。进而将该方法应用于多个科学计算内核代码,表明显式向量化在提升计算性能的同时,可以通过改变数据访问模式提高带宽性能。采用向量数据类型后,应用的性能最高提升了近16倍。通过与编译器的隐式自动向量化进行对比,发现两者在性能上差异不大,但显式向量化方法更加灵活可控。(3)针对存储访问,通过测试分析表明在MIC上使用Open CL本地内存的性能取决于应用本身的特点,本地内存的使用可以看做一种软件优化技术。通过分析模板计算的计算访存比,提出了并行的时间空间混合分块算法,并利用Open CL模型将其应用于七点模板计算,性能相比只采用空间分块提高了1.5倍。
其他文献
本论文研究多业务传送平台(MSTP)技术的实现以及在电信中的应用。 由于电信运营商面临着向综合业务转型的迫切需要,如何利用现有的资产实现对新技术、新业务的支持,一直是电
流线可视化是矢量场可视化的重要方法之一,具有计算量小、直观、适合交互分析等特性,在工程实践中应用广泛。流线可视化的效果依赖于流线种子点的数量和位置,种子点分布一直
P2P网络是近年来业界研究与关注的一个焦点,它在很多领域都得到了应用,未来发展空间很大。但是,P2P网络发展过程中,也产生了一系列急需研究和解决的问题,安全就是其中最重要的问题
随着计算机网络的飞速发展,网络管理面临的问题也越来越复杂,网络管理软件的功能也日趋强大,在提高了网络管理水平的同时,也对网络管理人员的经验水平提出了更高的要求。对于大多
随着无线通信和电子制造等工业技术的发展,嵌入式设备的功能越来越强大而价格却越来越低,以移动终端为主的嵌入式设备应用正在快速发展。嵌入式设备对平台和网络的兼容性、移动
随着油气田资源的深入开采与利用,储层微观结构的勘探开发和研究日益成为世界各国科技与经济竞争的焦点之一。获取精确的、大范围的岩石环境数据,是进行岩石组分分析、油气田
基于LTE(Long Term Evolution)的卫星移动通信系统将LTE标准和技术引入到卫星通信中,能有效利用LTE系统技术成熟、速率高、成本低和卫星通信覆盖范围广、抗毁性强等优势,在实
目前基于万维网服务的网络应用集成技术成为研究热点,这些网络应用可能跨越多个组织,系统部件随时可能不可用,并不断有新的服务提供者出现,如何将事务处理技术合理应用于这种分布
随着网络信息技术的发展与应用,民航行业信息化发展迅速。但由于多方面的原因,民航信息系统的安全性受到极大的威胁,因此必须采用可靠性非常高的安全保密技术来确保民航数据交换
ICN网络是解决TCP/IP网络中数据传输瓶颈的有效解决方案,ICN网络的挑战在于路由器自身的缓存空间有限,无法满足急剧增长的数据流量对存储空间需求。解决ICN网络缓存空间不足