多核处理器中多级缓存替换策略的设计

来源 :东南大学 | 被引量 : 0次 | 上传用户:dingmx
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
高速缓存是高性能处理器中提高访存速度的重要技术,其对处理器性能的影响至关重要。本论文主要针对基于包容式高速缓存结构的多核处理器中,多核共享的最下级缓存不清楚其上层缓存的使用情况而导致下级缓存将上级的常用数据无效掉的问题,提出一种感应上级的最近最少使用(LRU,Least Recently Used)替换策略,将上级高速缓存(Cache)的局部性信息发送给下级Cache,下级Cache在数据替换的时候,结合上级Cache和本级Cache综合的局部性信息进行替换,避免上述错误的无效掉上级Cache常用数据的情况。从而提高处理器执行效率和整体性能。在上述理论基础上,以GEM5处理器模拟器为设计与测试平台,修改缓存模型中最外层高速缓存(LLC,Last Level Cache)的替换策略的代码。具体方法主要为,在共享的LLC上加入upperAccess标志位,以upperAccess标志位的状态为上级Cache数据使用情况的判断依据,在LLC需要做出替换决定时优化LLC高速缓存行(Cacheline)的替换顺序,尽量避免上层缓存的常用数据被替换掉,从而完成感应上级的LRU替换策略的加入,并以此减少二级缓存(L2 Cache)和更上级Cache出现包含式受害者(Inlusuve Victim)现象的次数。在加入感应上级的LRU替换策略的模拟器模型中运行SPEC CPU2006测试集进行验证。以L2和L3 Cache的每千条指令的未命中数据(MPKI,Miss per Kilo Instruction)和每周期指令数(IPC,Instructions per cycle)数据为切入点,对比优化前后的缓存替换策略对系统整体性能的影响。对比多个测试项目的结果,优化后单核测试下的IPC平均提升1.35%,L2 Cache的MPKI平均降低1.5%。优化后多核测试的IPC数据平均提升3.83%,L3 cache的MPKI平均降低5.0%。验证了感应上级的LRU替换策略对解决Inclusive Victim问题有所帮助,并提高了Cache模型的整体性能。
其他文献
便携式、可穿戴设备的快速发展,柔性超级电容器因体积小,充电时间短、功率密度高、循环稳定性强、绿色友好等优点备受青睐。石墨烯具有优异的电/热导率、柔韧性和稳定性,聚苯
国防通信巡线车主要执行通信光缆的巡线和抢修两项重大任务,是实现通信高速、稳定、不间断的基础保障。城市地区的通信巡线车维护任务主要面临着实时性差、效率低、通信条件
高速城市化进程导致城市不透水下垫面的急剧增加,全球气候变暖使得极端气候频发形成城市热岛效应、雨岛效应,加上不完善的城市雨水排放系统,导致城市内涝灾害频发、水质恶化,
钢轨探伤小车是新一代铁路轨道探伤设备,具备沿线伤损自动识别功能。但其定位主要依赖里程计的航迹推算,存在累积误差且无法自动消除,需要人为校正;同时,探伤数据的存储也需
近年来,德国的被动式超低能耗建筑(以下简称被动房)技术在中国不断推广应用。目前在我国严寒地区仅有为数不多的被动式低能耗住宅,本文拟对该被动房入住率不同的3年供暖能耗
近年来,随着社会的发展,银行业务呈多样化,个人信贷业务逐渐兴起,盈利空间非常大。目前,大部分银行主要依靠工作人员根据自己的经验对客户进行评估来决定是否放贷,这其中主观性很强,对评估结果有一定的影响。如果能够通过数据科学地分析出哪些人在银行交易中信用度较高,那么就可以对这些人进行放贷,进而增加银行收益。在众多挖掘算法中,Apriori算法被人们使用的最多,近些年已被应用于对各行各业数据的挖掘研究。在
半导体晶面效应可以诱导光激发的电子与空穴分别迁移到不同的晶面,减小复合的机会,从而提高电荷分离效率。理解晶面诱导电荷分离的过程可以帮助人们设计出具有高催化活性的光
采用分导式多弹头是当下战略弹道导弹主流发展方向,惯性/星光复合制导精度评估与弹道折合是导弹武器试验的关键性问题。论文建立了误差传播数学模型,分析了导弹纯惯性制导方
禾谷类作物孢囊线虫(Cereal cyst nematodes,CCN)是危害全球小麦、大麦、燕麦等禾谷作物的重要寄生线虫类群,其中菲利普孢囊线虫(Heterodera flipjevi)和禾谷孢囊线虫(Hetero
目的:本研究通过对黑龙江中医大学附属第二医院推拿三科已确诊治疗的中央型腰椎间盘突出症患者的临床观察进行系统化的临床治疗研究,对中央型腰椎间盘突出症患者在临床上的症