论文部分内容阅读
作为解决大规模计算问题的重要手段,高性能计算技术被越来越广泛地应用到科学与工程的各个领域。然而,随着高性能计算机规模的不断扩大,系统峰值性能的迅速提高,应用程序的持续性能并未获得同比例的提高,两者间的差距日益扩大。因此,如何发现系统性能瓶颈,提高系统持续性能成为高性能计算研究领域急需解决的重点问题。本文以总装某预研项目“飞行器RCS(Radar Cross-Section)精确数值计算并行化研究及实现”为应用背景,围绕快速评价并行系统性能这一目标,对并行系统关键性能影响因素确定、并行系统性能模型建立及验证、并行应用开发方法改进、系统性能形式化分析方法等内容进行了深入研究。本文的主要工作包括:(1)提出面向性能的并行应用开发方法提出阶段式性能分析方法,将性能工程活动贯穿于并行应用开发过程的各个阶段,改变现有的先编写代码再分析性能的并行应用开发模式,减少因逻辑错误、性能瓶颈发现太晚而导致的额外开销。(2)提出基于赋时着色Petri网(Timed Coloured Petri Nets,简称TCPN)的并行系统性能模型建立及验证方法介绍了以PRM(Program Resource Mapping)思想为基础,层次化有限TCPN为手段的并行系统性能模型建设方案,并深入研究并行系统性能影响因素。采用PB(Plackett-Burman)实验方法快速提取并行机性能关键影响因素,并以PCA(Principal Component Analysis)分析法确定关键因素的性质及相互关系,从而将众多复杂的性能影响因素聚焦到少数几个相互独立的综合因素,突出了关键因素对系统性能的影响作用,保证了系统性能模型S-TCPN能够准确、抽象地描述并行机和并行应用的性能特征,为进一步的性能分析打下基础。设计了以相似度和匹配度为根据的并行系统分类方法,前者以计算对象间的距离d来判断并行机(或并行应用)是否为同类,然后通过积累典型应用在典型机器上运行时的性能评测结果,来降低同类应用在相同机器或相同应用在同类机器上运行时的性能分析难度;后者通过计算并行机和并行应用间的匹配度sim,来判断并行机能否为并行应用提供较好的运行环境。研究了过程正确并行应用的性能模型P-TCPN应具备的基本性质,提出了一系列并行应用及其性能模型的正确性验证算法,使之不仅能验证P-TCPN模型的正确性,而且能验证建模对象的正确性,避免出现性能模型正确而建模对象错误的情况。(3)提出基于模型的并行系统性能分析及评价方法为区分并行系统不同层次的性能评价指标,定义了宏观评价指标和微观评价指标概念。前者在Amdahl定律的基础上,改进并行效率计算方法,加入优化因子来评价并行系统优化后的性能,改变了低并行处理速度带来高加速比、高并行效率的矛盾现象,从整体上反映了并行系统性能特征;后者根据S-TCPN模型中token的变化计算了系统并行度、负载平衡、资源利用率等性能指标,从程序内部反映了并行系统性能特征。介绍了系统性能模型S-TCPN状态空间压缩方法,有效地防止了因状态爆炸而加重系统性能分析难度的情况。提供了从S-TCPN模型中获取并行系统性能数据的方法,并利用CPN Tools工具计算系统微观评价指标值,从而有效定位系统性能瓶颈,并根据瓶颈形成原因实现系统优化。