论文部分内容阅读
多核处理器中,各处理器间需要交换数据和控制信息,而核间通信已经成为制约多核系统发展的瓶颈。片上网络通过通信分布化的方式,有效地解决了多核系统的通信问题,成为多核核间通信的研究热点。但是随着片上网络规模日益增大,远距离通信性能低下,大大影响了片上网络整体性能。高性能远距离通信的解决方法之一,是在核间通信上引入加速网络。目前对于加速网络的研究基本着眼于硬件实现,鲜有从体系结构层面系统地分析如何进行性能优化。本文首先分析了带加速网络的片上网络硬件架构,对其性能优化进行了建模,具体从拓扑、路由、映射三个角度,研究了带加速网络的片上网络中加速节点的数量和布局、路由算法和映射算法三个方面,分析了提高带加速网络的片上网络性能的方法。本文的主要研究内容包括:(1)提出了带加速网络的片上网络拓扑优化方案。本文比较了最小化最远通信距离、最小化平均通信距离和最小化各节点到加速节点距离之和三种通信优化目标下最优布局的性能差异,选择了最小化平均通信距离作为通信优化的目标。通过分析不同加速节点数量下带加速网络的片上网络性能,本文提出了带加速网络的片上网络节点数量和布局选择方案,并给出了大规模片上网络下的加速节点布局的求解方法。(2)提出了带加速网络的片上网络路由优化方案。本文分析了仅电片上网络路由、总是使用加速网络的路由、优先使用加速网络的路由和优先使用电片上网络的路由四种路由策略,通过实验对比指出优先使用电片上网络的路由是其中较优的路由策略,并提出了预留带宽的电片上网络路由来降低加速节点周围的链路负载。(3)提出了带加速网络的片上网络映射优化方案。本文分析了带加速网络的片上网络映射与二维片上网络映射的差异,指明了适合于带加速网络的片上网络中的任务特点,并提出了优化全局映射的MGA算法和优化局部映射的ANCR算法。本文对于8×8规模的片上网络使用4个加速节点并按照最小化平均通信距离的方式布局,并采用优先使用电片上网络路由。通过对平均分布的通信模型的分析,预留带宽的电片上网路由能降低12.5%的加速节点周围的链路负载,提高整个网络的吞吐量。通过对PARSEC测试集等实验分析,本文提出的带加速网络的片上网络映射算法MGA算法和ANCR算法能分别降低28.8%和15.6%的整体通信代价,以及17.4%和10.2%的平均延时。实验数据表明,本文提出的性能优化方法,有效地提高加速网络的使用效率,均衡片上网络的链路负载,提升整个网络的吞吐量,降低任务的总体通信代价和平均延时。