【摘 要】
:
随着Infiniband在HPC系统互连领域所占份额日趋扩大,用户迫切需要一种能够利用Infiniband优化性能同时又具有容错功能支持高可 用的MPI编程模型。本文提出了一种适合Infiniband的MPI容错协议,据此推出一个对应用透明的支持系统级保留恢复的原型系统。该系统通过了NAS、PMB 和多道应用课题512-1200个核规模的测试。
【出 处】
:
2008年全国高性能计算机学术年会
论文部分内容阅读
随着Infiniband在HPC系统互连领域所占份额日趋扩大,用户迫切需要一种能够利用Infiniband优化性能同时又具有容错功能支持高可 用的MPI编程模型。本文提出了一种适合Infiniband的MPI容错协议,据此推出一个对应用透明的支持系统级保留恢复的原型系统。该系统通过了NAS、PMB 和多道应用课题512-1200个核规模的测试。
其他文献
以双核、四核处理器为代表的多核计算平台正在逐步成为服务器的主流架构,在这种架构下传统的遥感图像并行处理算法的性能问题成为随之而来的问题。本文通过在多核服务器平台和单核架构的集群平台上对于并行卫星多光谱图像自动配准算法进行比较研究和性能测试,分析和阐述了多核对高性能计算的影响。
随着多核处理器的发展,片外访存带宽逐渐成为影响程序性能的主要因素。为了解决这个问题,很多研究工作通过提高cache利用率来降低程序执行过程中的片外访存数量。本文提出了一种任务调度算法来解决同时执行的多个独立任务竞争片外访存带宽的问题。该调度算法根据程序的访存阶段调度同时执行的多个独立任务,避免了“爆发式”的片外访存请求,改善了片外 访存带宽的利用率,提高了系统吞吐率。本文基于函数调用和循环体执行轨
在计算机安全领域,如何提高RSA算法的速度一直是研究的热点。近年来,随着多核技术与并行技术的发展,程序员可以通过使用MPI、OpenMP和Pthreads等并行技术来提高程序的效率。本文基于以上背景,在理解传统RSA算法原理的基础上,充分挖掘RSA算法的并行性,再结合MPI、OpenMP和Pthreads等并行技术和利用OpenSSL软件包,设计、实现了RSA并行算法,并取得了明显的效果。最后通过
局部一维显式离散格式是构造高维流体力学计算格式的常用计算方法。本文给出了一个并行自适应显式时间积分算法,用于实现局部一维显式离散格式的并行自适应计算。基于JASMIN框架,以局部一维FCT格式为例实现该算法,形成一个用于模拟多介质流体力学Richtmyer-Meshkov不稳定性的并行自适应数值模拟程序。数值实验表明,该程序具有很好的并行可扩展性。
高性能并行计算的唯一目的就是追求尽可能高的极限性能,这一尝试包括使用最先进的超级计算机,最快的并行算法,也包括选择更合适的编程模型与最大化程序性能的优化方法。现代网络支持RDMA以及PGAS语言,如UPC,支持远端CPU无意识的单边通信,这些特性促进了高效重叠通信与计算的优化,可以显著提高通信受限程序的性能。但是通常传统并行程序,主要是MPI程序,多使用大块通信和计算,这样重叠优化的空间很小,我们
线程级投机并行可以利用多核系统的计算能力提高应用程序的性能。串行程序被分割为多个线程并行执行,通过运行时系统保证对包含数据依赖代码按照其串行次序执行。投机成功时,可以极大增加系统并发度,但是投机失败时开销较大。对于一类发生次数不多的数据依赖,采用线程间同步机制,可以避免投机失败,从而减少开销。本文提出了一种把循环转换为线程投机执行的框架LLSM。LLSM可以把常规编译方法难以并行的循环切割转换为多
并行计算机系统提供了强大的并行计算和批处理能力,作为其作业管理软件的重要组成部分,作业调度器的设计关系到整个系统的利用率、吞吐率。本文主要介绍了一种超大规模并行计算机系统作业调度模块的设计和实现。
在科学计算中,循环结构是最重要的行对象之一。本文在考虑负载平衡、调度开销等多面因素的基础上,OpenMP标准制定了静态调度动态调度、指数调度和运行时调度等不同策略针对指数调度策略不适合递减型循环结构的点,提出一种改进的new_guided 指数调度略,并在OMPi 编译器上加以实现。new_guided调度策略的主要思想是对前半部分的循环采静态调度,后半部分的循环采用指数调度。
本文针对虚拟化环境下的多种异构操作系统部署,摸索出了一套切实可行的解决方案,并在神威集群系统环境中得到应用。
在生命体复杂的生命过程中,蛋白质翻译后修饰(PTMs)的调控作用尤为关键。当前,对于蛋白质翻译后修饰的鉴定无疑已成为计算 蛋白质组学的重要任务。InsPecT软件因能盲搜索鉴定蛋白质翻译后修饰而备受瞩目,但其计算时间复杂度之高却是应用的主要瓶颈。本文针对InsPecT软件分别实现了对等和主从两种模式的并行优化方案。比较结果显示,主从模式并行的P_InsPecT软件,因采用了有效的数据动态分配方法与