众核处理器中Cache一致性机制的动态可重构设计

来源 :上海交通大学 | 被引量 : 0次 | 上传用户：czw6243579

【摘要】

：

在过去的十几年中,随着工艺尺寸的进步,单芯片集成处理器核数逐步增加,众核处理器成为微处理器发展的趋势之一。传统的总线互连结构已无法适应众核处理器的需求,因此具有高并

【作者】

：

韩兴

【出处】

：

上海交通大学

【发表日期】

：

2016年01期

【关键词】

：

众核处理器 Cache 一致性协议片上网络动态可重构子网划分广播消息传递无死锁路由算法

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

在过去的十几年中,随着工艺尺寸的进步,单芯片集成处理器核数逐步增加,众核处理器成为微处理器发展的趋势之一。传统的总线互连结构已无法适应众核处理器的需求,因此具有高并发特性的片上互连网络(No C)等非顺序互连结构逐渐成为众核处理器中片上互连结构的主流趋势。非顺序互连结构的使用,增加了Cache一致性协议机制的设计复杂度和硬件开销,其高昂的代价限制了众核处理器的性能,即Cache一致性墙(Coherence Wall)的问题。为提高众核处理器中基于Cache一致性协议的核间通信性能,本文基于Cache一致性分区机制,在以下方面进行了研究:1)动态可扩展的Cache一致性分区机制。随着众核处理器中No C规模的增加,Cache一致性协议通常会带来巨大的广播和多播通信代价。当前的Cache一致性协议性能提升通常通过降低通信次数完成,但是其硬件代价较高;静态分区机制可以较低硬件开销避免No C规模上升带来的核间通信性能下降,但是其灵活度较低;而动态分区机制中Cache一致性协议设计较为复杂。由于并行应用程序在使用超过16个处理器核时加速比有限,为应对未来大规模众核处理器的应用场景,本文结合动态可扩展的子网划分机制,提出了动态可扩展的Cache一致性分区(SCCP)机制。基于Gem5的仿真测试表明,相较Token协议0.98%的额外硬件资源开销,SCCP机制以1.67%的硬件开销,提升平均18.8%的Cache系统性能和9%的系统总体性能。同时,与额外硬件开销为3.30%的Di Co协议相比,SCCP机制具有相近的性能。2)针对支持动态可扩展Cache一致性分区的不规则拓扑的子网划分机制。子网划分机制能够有效限制众核处理器中广播和多播的范围,降低并行应用程序之间的通信干扰,提高数据共享和核间通信的性能。传统的子网划分机制通常采用最佳适配的拓扑结构覆盖子网;该机制虽然能够减少广播范围和网络中数据包的数量,但是由于可用路由链路的减少会带来网络拥塞,从而增加了子网内数据包的平均网络延时。在本文提出的支持不规则拓扑结构的子网划分机制中,采用多个矩形子网嵌套的物理子网覆盖逻辑子网,可提供更多可用的路由路径。仿真测试表明,针对众核处理器中Cache一致性协议常见的5~10%的广播率,较当前已有的子网划分机制相比,可获得10%左右的性能提升。子网嵌套的子网划分机制可有效降低无死锁路由的设计复杂度,同时每个路由节点仅需添加两位寄存器,具有较低硬件代价。3)兼容消息传递机制的动态可重构Cache结构设计。为解决众核处理器中Cache一致性协议带来的核间通信的延时,现有的众核处理器及研究中提出了片内硬件支持的消息传递机制,提升了约13%的系统性能。然而在大规模众核处理器的设计中,通常采用轻量级核心运行单线程,因此在运算时独立的消息传递缓存(MPB)处于闲置状态;同时,运算时的Cache访问延时对独立MPB机制的整体性能也有重要的影响。因此,本文基于现有的Cache一致性协议,提出了可重构为MPB的动态可重构Cache结构(RMCC),可按需将片上SRAM存储重构为Cache或MPB使用;RMCC机制通过复用逻辑电路对基础Cache协议的状态进行扩展,在重构的Cache存储上实现了消息传递机制。仿真实验表明,相较硬件额外开销为5.26%的独立MPB机制,RMCC机制可以在相同的硬件开销下降低8%的Cache缺失率,在当前独立MPB实现机制基础上,提升约11.4%的性能;另外,在避免MPB的5.26%额外开销的情况下,可以带来与独立MPB机制相近的总体系统性能。本文针对众核处理器设计中面临的Cache一致性墙的挑战,分别对Cache一致性协议和子网划分机制进行研究和设计,同时兼顾片上消息传递机制的可重构设计,有效提高了众核处理器核间通信和数据共享性能。

其他文献

棘孢木霉天冬氨酸蛋白酶基因克隆和在毕赤酵母中的表达

木霉菌(Trichoderma spp.)是一种应用前景广阔的植物病害生物防治菌,含有很多优良的生物防治基因,棘孢木霉天冬氨酸蛋白酶基因就是其中之一。天冬氨酸蛋白酶(aspartic protei

学位

棘孢木霉天冬氨酸蛋白酶基因酵母表达酶学特性生物防治

潜在靶基因ET-1与Ambra1在前列腺癌中的作用机理研究

目的:在男性癌症中前列腺癌发病频率排第二,致死率排第六。近些年通过大量测序工作筛选到了多个与前列腺癌诊断和治疗相关的生物分子标志物。对这些分子标志物的充分研究和认

学位

前列腺癌ET-1Ambra1化疗耐药致癌基因自噬

高星级酒店转型:坚定、理性、专业

编者按$$ 当前，在全国高星级酒店业绩普遍下滑的市场形势下，为应对困难、减少损失，很多企业纷纷掘金大众市场，团购、促销，卖低价菜、做百姓食堂等，成为暂时性应急之策。如何看待

报纸

在全国低渗透油田开发技术座谈会上的总结讲话

在全国低渗透油田开发技术座谈会上的总结讲话ＡＳｕｍｍａｒｙＳｐｅｅｃｈａｔｔｈｅＮａｔｉｏｎａｌＳｙｍｐｏｓｉｕｍｏｆＤｅｖｅｌｏｐｍｅｎｔＴｅｃｈｎｉｑｕｅｏｆＬｏｗＰｅｒｍｅａｂｉｌｉｔｙＯｉｌ－Ｆｉｅｌｄｓ￥／／罗英俊中国石油天然气总公司开发生...

期刊

低渗透油田开发中国石油天然气总公司油藏工程采油工程低渗透储层低渗透储量座谈会

胃肠道神经内分泌癌(WHO G3)的异质性和个体化治疗

<正>神经内分泌肿瘤(NENs)是起源于神经内分泌细胞的一类高度异质性肿瘤,在胚胎起源、生物学行为以及临床病理特征方面均存在很大差异,胃肠道是该类疾病最常见的发病部位。对

期刊

NEC长效奥曲肽胃肠道WHO G3无进展生存期兰瑞肽神经内分泌癌异质性个体化治疗

Ilizarov技术治疗儿童双下肢不等长

目的:探讨Ilizarov技术在治疗儿童双下肢不等长的治疗效果。方法:回顾性分析从2011年1月到2016年12月本院收治住院的采用Ilizarov技术进行骨延长治疗的31例双下肢不等长的临床资料.结果:观察31例患儿术前及术后肢体长度均不服从正态分布,随访6-60月,平均25月。肢体短缩长度为2.2-16 cm,术前双下肢长度差4.4cm(3.5cm,6.5cm),术后双下肢长度差0.5cm(0

学位

Ilizarov技术肢体延长双下肢不等长外固定儿童

经济新常态下A钢铁企业的价值评估

钢铁工业是国民经济的重要支柱产业,在近10年间,我国钢铁工业飞速发展,有了长足的进步。但是,长期以来钢铁工业粗放发展,过于重视产量,对产品质量及装备制造水平关注不够,导致生产效率提升缓慢,产品质量与发达国家依然差距较大。随着近年来经济增长速度的不断下将,多年来所积累的矛盾显现出来,产能过剩、装备落后、产品低端、且产品同质化等问题困扰着中国钢铁企业。针对目前经济发展新常态的情况,国家着力进行经济结构

学位

价值评估钢铁企业经济新常态

电子舌/电子鼻技术在酒类中的研究及应用

电子舌和电子鼻技术是一种模拟仿真技术,介绍了两者的基本原理和模式识别方法。探讨了电子舌和电子鼻技术在白酒、黄酒和葡萄酒等酒中的研究及应用,包括酒类风味分析、酒类原

期刊

电子舌电子鼻酒

COPD大鼠Ⅱ型肺泡上皮细胞凋亡水平变化及吸入糖皮质激素对其的影响

目的研究慢性阻塞性肺疾病(COPD)大鼠Ⅱ型肺泡上皮细胞(type Ⅱ alveolar epithelial cell,AEC Ⅱ)凋亡水平变化,并探讨AEC Ⅱ凋亡在COPD发病机制中的作用及吸入糖皮质激素

学位

慢性阻塞性肺疾病Ⅱ型肺泡上皮细胞细胞凋亡糖皮质激素

艺术张力在动画分镜头设计中的应用研究

分镜头设计是一个将文字剧本转化为画面剧本的过程,是我们选择用何种方法和语调向观众讲述故事的机会。这个机会的把握程度正是动画创作者的视听语言表达能力的直观体现,将直

期刊

艺术张力动画创作分镜头设计

众核处理器中Cache一致性机制的动态可重构设计

与本文相关的学术论文