论文部分内容阅读
随着超级计算机规模的不断扩大,并行算法与并行机相结合的可扩展性研究日益得到重视,同时并行应用程序的可扩展性研究也愈为迫切。针对这种应用需求,本文对可扩展模型、可扩展性度量方法和分析准则进行了研究,并将有关结论应用到具体的应用程序中。本文的研究与创新工作概括如下: (1)并行计算模型是研究并行计算可扩展性的基础。本文在深入分析已有并行计算模型的基础上,对常用并行计算模型进行分类,指出了它们的适用范围和优缺点。 (2)深入分析了可扩展性与执行时间、可扩展性与单机性能之间的关系。结果表明:如果片面强调执行时间或单机性能,可能会对可扩展性带来不利的影响。从理论和实验上分析了任务和数据分配策略对并行系统可扩展性的影响。 (3)首次从费用有效性的角度,提出了近优可扩展模型。它不仅可以描述并行系统的可扩展能力,而且可以根据小规模系统的性能指标,预测更大规模应用问题在接近最优条件下(即执行时间接近最短时间,而效率不低)运行所需要的处理机数目。从而帮助用户实现合理的处理机配置。 (4)提出了三种可扩展性度量方法,即时间可扩展性、效率可扩展性和收敛可扩展性。原有可扩展性度量方法难以衡量由算法实现差别导致的并行系统可扩展性的差异,新方法弥补了上述不足,并具有易于度量的优点。 (5)提出了一套可扩展性分析准则,用来帮助确定并行系统可扩展性低的原因。 (6)采用上述方法分析了核物理和CFD领域中的三个并行应用程序的可扩展性,并验证了上述结论。这三个程序分别是二维电磁等离子体粒子云网格法程序(2D-CIC),跟踪界面活动网格法程序(YGX),三维高超声速流场数值模拟程序(TXD)。同时对它们进行了资源需求分析。 (7)针对异构系统,改进了一种性能模型,并提出了一种静态任务分配策略。实验结果表明,这种分配策略可以较好地实现负载平衡。分析和发展了资源受限条件下有效利用资源的方法。对一些典型算法的分析表明,这种方法可以预测在资源受限的异构计算环境下,并行算法获得最短执行时间所需的处理机数目。 (8)异构计算是当前研究热点,而以往的可扩展性研究集中于对同构系统的分析。本文针对基于同构网络的异构机群系统,提出了一种可扩展模型。对一些典型算法的分析表明,这个模型可以描述算法在上述异构系统上的可扩展能力。 (9)实现了二个CFD应用程序的并行化。它们分别是:超声速高阶面元法程序和欧拉方程数值模拟程序。在并行化过程中考虑了并行程序的可扩展能力,对可扩展性国防科学技术人学研究生院学位论文研究在指导并行程序设计方面的应用进行了一定的探索。