论文部分内容阅读
随着制造工艺和体系结构技术的发展,片上多核处理器上集成的处理器核数目急剧增加,给片上存储系统带来越来越大的压力。当前大部分多核处理器均采用大容量的末级Cache结构来缓解“存储墙”问题。如何有效地组织和优化多核处理器的末级 Cache已经成为当前的研究热点。针对这个问题,本文深入研究了当前主要的一些末级 Cache优化技术,提出了一些新的方法和技术。本研究主要内容包括: ⑴提出了一种信息块的控制复制(CR)策略。信息块的复制技术是一种降低大容量 Cache片上访问延迟的重要方法,但是目前大部分块复制技术要么没有考虑复制的有效性,要么实现比较复杂。本文提出的CR策略通过控制信息块在Cache中进行复制的时机,减少了不必要的复制操作,提高了Cache空间的使用效率,大大降低了片外访存的几率,提高了系统性能。 ⑵提出了基于私有设计的分布式Cache划分(DCP)方法。大容量末级Cache主要有两种组织方式:私有设计和共享设计。目前大部分 Cache划分方法都是针对共享设计而言的,但是,当多个私有Cache采用一些方法实现共享以后,同样存在空间划分的问题。DCP方法采用一种分布式一致性引擎将多个私有Cache变成一个逻辑上共享的Cache,在这之上按照每个应用程序对Cache空间的利用率来划分空间,提高了Cache空间的使用效率。 ⑶提出了一种访存时间最优Cache划分(OMTP)方法。为了提高系统吞吐率,目前的大部分 Cache划分方法都是以失效率作为基本的优化目标。但是,由于存储级并行(MLP)现象的存在,失效率最优并不能代表实际性能最优。OMTP方法将应用程序访存特征与平均失效开销同时纳入考虑,将多个程序在占用不同路数时失效率的变化情况跟每个应用的平均 MLP失效开销一起作为划分的依据,按照每个应用在访存时间上对Cache空间的使用效率来进行划分,进一步提高了划分的性能。 ⑷提出了一种易饱应用优先的公平 Cache划分(FCPP)方法。当前大部分Cache划分方法都以提高系统吞吐率作为优化目标,而忽略了对Cache系统公平性的考虑,而有些划分方法以 Cache系统的公平性为研究目标,但又忽略了系统吞吐率方面的考虑。本文通过研究发现,有一种应用程序只需要很少的Cache空间,就可以满足其对访存的需求,将这一类应用称之为“易饱”应用。在动态给同时执行的多个应用程序划分空间时,优先满足这些易饱应用程序。然后在其余的应用程序之间公平划分Cache空间。跟已有的公平Cache划分方法相比,FCPP方法在不损害公平性的情况下,较大提高了系统吞吐率。