神威·太湖之光上分子动力学软件的实现与优化

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:xiertimer
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
神威·太湖之光是我国自主研制的新一代超级计算机系统,全系统峰值性能为每秒12.54亿亿次,持续运算速度为每秒9.3亿亿次,均位居当今世界第一。该系统采用了 40960颗申威26010众核处理器,共计1040万个处理器核心。申威26010处理器采用64位自主设计的申威指令系统和自主核心技术,核心工作频率1.45GHz,峰值性能每秒3.168万亿次浮点计算。神威·太湖之光通过构建自己的软硬件体系以保障从软件和硬件两个方面实现超级计算机系统的完全自主安全可控。由此带来的问题是,现有的应用软件无法通过简单的移植运行在该系统上,而是需要结合该系统的结构特点进行重新实现和优化。NAMD是一款基于Charm++并行编程模型的开源分子动力学模拟软件,能够在大规模并行计算机上快速模拟百万原子级别的大分子体系,曾获得过美国三大工程奖之一的戈登·贝尔奖,广泛应用于物理,化学,生物,材料,医学等各个领域。本文的研究目标是突破前人在十亿亿次系统上移植和优化NAMD软件遇到的一系列挑战性难题,在芯片级和系统级探索在神威·太湖之光上提升并行效率的方法,为其它大规模并行软件的移植和优化提供借鉴。本文的研究工作及成果主要包括:(1)NAMD软件在神威·太湖之光上的实现。通过深入分析NAMD的软件结构,热点计算函数,计算、访存、通信和I/O特征,以及Charm++并行编程模型和运行时,将其计算任务进行切分,并消除任务间的依赖关系,从而实现了NAMD软件在申威处理器上的并行实现方案。在移植NAMD依赖的第三方库时,采用交叉编译实现了 TCL,FFTW和Charm++在申威处理器上的移植。(2)NAMD软件在申威众核处理器上的芯片级优化。针对NAMD软件运行时特征和申威处理器结构特点,提出单节点上的优化方案,对NAMD软件进行软硬件一体化优化,包括数据访存优化,处理器内部工作模式优化以及针对处理器硬件特性做出的优化等。实验分析表明,优化后的程序性能较优化前提高了20倍左右。(3)NAMD软件在神威·太湖之光上的系统级优化。针对神威·太湖之光超大规模系统结构特点,提出了一种新的任务划分和负载平衡控制模型,解决了在超大规模下多机并行效率问题。实验分析表明,采用新的模型,当计算规模扩展到500万个原子时,可扩展至50000核组(325万核),程序性能提高了将近一倍。
其他文献
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
目的观察二甲双胍相关性维生素B12缺乏患者使用甲钴胺或碳酸钙或两者联用的治疗效果。方法选择2014年6月~2016年6月在浙江省湖州市第三人民医院内分泌科门诊及住院的连续服用
为了量化密集烘烤过程中烟叶形态变化的数字特征指标,实现成熟烟叶与烘烤过程烟叶β-胡萝卜素含量及水分含量的无损检测,以成熟烟叶及密集烤房不同烘烤阶段共450片烟叶为研究对
易班(E-class)是"互联网+"时代背景下大学生网络思想政治教育的新探索。基于易班(E-class)平台增强大学生思想政治教育实效性具有现实可行性,但同时也存在一些阻滞因素。因此
摘要:从丽水气象人才队伍的学历结构、职称结构和年龄结构等入手,分析近20余年来丽水市及所属气象台站在人才队伍结构上的动态变化,结合遂昌、云和2个气象局在人才队伍建设上的
若干年前,很难想象整店输出的概念、安利或PPG直销的模式,以及像阿里巴巴那样利用B2B概念就可以赚钱的商业模式。当然,在人们热衷于抢夺黄金、石油的年代,更加无法想象在信息
期刊
简要介绍了现代制造技术中常用孔加工刀具的种类、硬质合金刀具的材料与制备。以钻头为例,分析了刀具参数、刃磨、刃口钝化技术对切削性能的影响,综述了硬质合金孔加工刀具技
目的:探讨分段开窗旷置结合切扩挂线置管引流术治疗复杂性肛瘘的临床疗效。方法:选择我院2014年10月-2015年10月收治的68例复杂性肛瘘患者,将68例患者随机为对照组(n=34)和观
人力资源在建设一流高校中具有至关重要的作用,如何才能全面、有效地发挥出人力资源在建设一流高校过程中的作用成为各大高校负责人必须认真思考的问题。为实现人力资源在一