论文部分内容阅读
随着半导体工艺技术的不断发展,片上系统面临漏电功耗等一系列问题,集成电路设计逐渐由高性能单核CPU设计转向高性能多核通信网络设计,由于多核芯片中集成的核心数目越来越多,片上互连结构逐渐由总线点对点互连发展为片上网络无序互连。片上网络相较于传统总线互连结构,具有较大的并行计算的开发潜力,逐渐成为多核乃至众核系统的研究热点。片上网络作为一个庞大的通信系统,对其研究的可以从拓扑结构,路由算法,流控机制,路由器微结构等方面入手。针对不同的应用场景,片上网络可以实现不同的定制化优化,与网络性能的提高。通信互连结构的变化,使得适用于总线结构的传统侦听一致性协议不再有效,目录协议,token协议等新型缓存一致性协议对片上网络提出了新的要求。基于多核缓存一致性协议在片上网络上表现出的多播流量的特点,本文分别从实现自适应与更小多播树的路由算法和设计支持该多播算法的硬件多播复制路由器两个角度入手,对片上网络进行针对性优化。本文设计的全区域自适应递归分区多播路由算法,基于最短路径路由的前提,尽可能实现多播包的链路复用,有效提高了网络负载能力,同时对自适应路由的全区域支持,也降低了平均数据包传输延迟。经仿真实验,在3.88%至64%的多播数据包占比激励范围下,相对于基准DPM路由算法能平均提高23.61%饱和吞吐率,即使相对于部分自适应优化的DPM算法,也能平均提高5.30%。本文设计的自适应多播复制路由器,能在不消耗额外硬件面积的情况下根据网络拥塞情况自适应的进行同步并行多播包复制与串行多播包复制,相对于传统的单播路由器与单读指针串行复制路由器,能明显降低数据包传输延迟,提高网络吞吐率。经仿真实验,在3.88%至64%的多播数据包占比激励范围下,相对于单播路由器,能平均提高41.14%饱和吞吐率,而相对串行多播复制路由器也能平均提高6.06%。本文的硬件实现采用verilog语言,仿真平台采用systemverilog搭建。在多种多播包负载的随机激励下,结果表明本文设计的自适应多播复制路由器与全区域自适应递归分区多播路由算法均能有效的支撑多核一致性引起多播流量,降低数据包传输延迟,优化的数据传输效率,提高网络吞吐率,提升片上网络性能。