基于智能网卡支持的并行通信协议的研究

来源 :中国科学院计算技术研究所 | 被引量 : 2次 | 上传用户:sakurabb1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前,以SMP服务器作为结点的机群系统被普遍采用。由于单个结点上多个CPU的使用,机群对结点间的通信带宽提出更高的要求。虽然目前的高性能通信网络得到迅速的发展,但因受物理硬件和I/O总线带宽等方面的限制,单套网络的性能仍无法满足其需求,这使得并行通信技术具有重要的意义。并行通信技术多种多样,其中以消息分片技术为主。当前并行通信中的分片机制主要是基于底层RMA通信协议之上的,而RMA通信协议本身是面向大消息的,因此并行通信只适合于大消息。虽然也可将该并行机制应用于中等长度的消息(3k至16k),但由于RMA协议中主机层握手的开销很大,使得其性能提高非常有限,而中等长度的消息一直是众多应用程序的主要消息段,因此,传统的并行通信协议依然无法满足目前的需要。为了解决这一问题,本文引入了基于智能网卡支持的并行通信协议。所谓基于智能网卡支持的并行通信协议,就是指消息发送过程中让网卡参与并行通信处理,其实质就是对MPI中的Eager协议进行并行化。由于Eager协议在发送消息前并不知道接收端的缓冲区地址,因此,为了能够正确地进行消息重组,在实现并行时引入了握手机制,通过握手返回接收端的缓冲区地址,从而可以根据该地址以及各消息分片的偏移量确定消息在接收端的存放位置。本协议吸取了RMA通信机制中主机层握手的不足之处,将握手机制下移到网卡上实现,从而缩短了握手的过程,提高了并行通信性能。本文最后对基于智能网卡支持的并行通信协议进行性能评测。在网络通信性能上,与BCL-4[41](基于RMA机制的并行通信系统)相比,它提高了3K到17K范围的通信带宽;在应用性能上,对不同的程序性能提高程度是不同的,最好的情况,如FT程序,该并行协议使执行时间减少了9.0%,而BCL-4只减少了6.6%。此外,本文分析了影响并行通信性能的主要因素,为以后的并行研究工作提供了重要的参考意见。
其他文献
本文提出了基于Web Service的电子公文安全交换系统.系统以PKI体系作为安全基础设施,利用人体唯一性生物特征——手写签名进行安全认证,利用信息隐藏技术实现认证信息与电子
本文首先分析阐述了自主管理的内涵,将自主能力分为不同的等级,从而将自主管理系统划分为不同的层次,每层提供不同程度的自主能力。然后依据这一思想设计了小行星探测器
在软件技术的研究中,AOP 以其对横切封装的特性改善了OOP 中的代码冗余以及代码分散等缺陷,逐渐成为新一代的程序设计思想。而AOP 架构的实现更成为了AOP 技术中研究的热点和
信息技术的飞速发展正在引发着一场深刻的生产和生活方式的变革,极大地推动着经济和社会的发展。建设“电子政府”已经成为世界新一轮公共行政管理改革和衡量国家及城市竞争力
互联网的飞速发展给人们的日常工作带来了前所未有的便利,随之而来的安全问题也越来越难以回避。受各种原因的驱使及攻击工具的增加与使用的方便,入侵事件日益猖獗。为了增强
本文对视频编码中的关键技术-熵编码技术进行了研究,针对高清晰度视频提出基于复合上下文的熵编码器,并进一步研究了算术编码器CABAC,提出新的8*8DCT系数的算术编码方法.目前
本文在对声音信号采集、特征提取以及场景分类技术等理论全面分析的基础上,提出了一系列新的时域特征提取方法如帧内平均峰值能量、帧内峰值能量方差、带通过零率等和各维特
本文首先分析了一些已有的自动评价方法,如孤立点测试法、BLEU/NIST方法、GTM方法以及智能度方法等,通过实验验证了他们在英汉翻译评价应用中的可行性,并针对汉语语言的特殊
本文对语音保密通信中必须经历的数模、模数转换过程进行了研究.文中讨论了音频信号在数模、模数转换过程中受到的影响,其中主要包括信道噪声、量化误差、时域漂移、幅值差异
随着现代工业技术的不断发展,机械设备运行周期越来越长,速度也不断变快,人民对于其安全性的要求也不断提高,为此,一种能够实时地检测出机械设备健康状况的方法就显得十分有必要。