论文部分内容阅读
随着计算机硬件及高速网络的飞速发展,集群系统以其较高的性价比等特点成为并行处理领域的重要研究方向.性能是构建集群系统的主要动机,因此集群系统的性能测量成为一个重要的研究课题.由于集群系统性能测量方法的复杂性,很难使用单一的简单的测量对其进行完全的评价.目前最常用的测量方法是,使用测评不同性能的集群性能基准测试.其中,主要分为对计算能力进行测量的基准测试,对通信性能测量的基准测试以及对某特定应用(例如Web服务,数据库服务)性能的基准测试.在该文中,集中进行了有关集群系统通信性能方面测量的研究.该文首先介绍了基准测试的概念,并指出作为一个优秀的基准测试应该具有的优点,简要的介绍了现今流行的测量各种不同性能的基准测试.在该实验室的条件下,构建了PC集群和Sun工作站集群系统,并安装了PVM和MPI两种集群计算环境.该文分析了NetPIPE基准测试的测试原理,并使用该基准测试对实验室搭建的集群系统的通信性能进行了测试,实验结果与理论分析一致,表明在通信性能方面,MPI环境整体上优于PVM.并通过分析表明,合并一些非相关短消息为长消息能够优化集群应用.由于集群系统中最主要的通信子系统的开销来自于软件层,例如系统调用、缓存管理、数据备份等.因此测量这些通信子系统中软件层的开销对于理解集群通信性能也是非常有益的.因此该论文还采用了Lmbench基准测试进行了集群节点内部的延时和带宽的测量.并对在该实验室两种集群系统节点上的测试结果进行了对比分析.最后,由于各种通信基准测试通常都只是简单都进行通信参数(通常为延时和带宽)的测量,不容易对整个集群通信子系统的通信性能有全面的表征,因此该文最后一部分采用了性能模拟的方法,以基准测试为工具,对该实验室两个集群系统的带参数的LogP通信模型进行了定量化的测量和计算.文中最后总结了该研究的意义和不足,并指出将来可以继续改进的方向.