基于三级流水RISC CPU的Cache的设计

来源 :东南大学 | 被引量 : 0次 | 上传用户:a234917658
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着集成电路工艺的改进以及处理器性能的日益提高,CPU与主存储器之间速度的差异越来越大,主存的速度成为制约芯片性能提高的主要瓶颈。尽管有多种解决方案可以解决该问题,但在处理器中增加一个Cache是目前被普遍应用的一种有效方法。具体到本论文,3级流水的RISCCPU(亦称Minicore)在100MHz的主频运行时,其片上FLASH的读操作需要4个周期的等待,也就是总共5个周期可以读取一个数据,这对于某些性能较高的需求并不适用。而Cache命中时一个周期就能读取一个数据,可以满足某些性能较高的需求。本论文设计的Cache期望能在100MHz的主频下达到90%以上的命中率,且面积最优。   论文设计的Cache是分离式的Cache,一个指令Cache和一个数据Cache。指令Cache容量为1KB,数据Cache容量为256B。指令Cache和数据Cache均设计为4路组关联映射,Block大小均设计为16B,在两个Cache中均实现了写穿策略,读操作分配策略,伪LRU(LeastRecentlyUsed,最近最少使用)替换算法。论文在充分理解Cache基本原理的基础上,在RISCCPU内核中实现了ICache和DCache的状态机,解决了在不使能、使能时命中以及使能时缺失三种情况下对指令和数据的处理问题;论文采用伪LRU替换算法,该算法采用k-1(k是组关联映射中WAY的数目,论文中k=4)个状态位来决定要替换的行,保留了LRU算法的优点又避免了其缺点,经仿真验证性能较高;为提高Cache缺失时的性能,论文对FLASH模块做了一些优化;同时为兼容Cache,论文对Minicore内核中总线矩阵的逻辑也做了一些改进。   论文对所做的设计进行了VCS仿真和FPGA验证,经仿真,Cache功能正确且对于论文采用的4个应用较为普遍且循环较多的程序,系统加了Cache后命中率都能达到90%以上,加了Cache后CPU的平均执行速度比不加Cache提升了2~3倍,其中命中率最低的程序速度提升也能达到1.6倍。
其他文献
本文通过对荣华二采区10
期刊
随着社交媒体技术的逐步发展与成熟,特别是手机的智能化发展,人们对手机的依赖越来越严重.根据近几年的网络统计发现,中国手机用户人数已经占据人口总数的87%,参与问卷调查的
为研究口蹄疫病毒(FMDV)表面抗原VP1在植物中的表达,分离克隆了“O”型FMDV表面抗原VP1基因,以马铃薯块茎特异性表达的Patatin启动子分别构建了2个植物双元表达载体pBIVP和pB
医疗事业作为我国的一项重要基础事业,其发展水平关系到我国人民的生命安全和身体健康,所以随着人们生活水平的提高和健康意识的增强,对于医院的服务也有了更高的要求,加上受
本文主要针对大数据下会计电算化与审计结合现状及对策展开论述,先介绍了会计电算化与审计结合现状,然后有针对性地提出了几点完善对策,如注重高效化数据审计软件的开发、完
Recombineering(重组工程)是近年来兴起的一项新型基因操作技术。与传统的遗传工程技术相比,重组工程不需要限制酶和连接酶,仅需要用PCR方法合成线性DNA打靶分子,在大肠杆菌体
随着我国广播电视射频技术和信息技术不断发展,电磁辐射已经成为关注的焦点,如何保障工作人员以及人们的身体健康成为研究的重点.因此,本文基于电磁辐射概念,分析了对人体的
近年来,媒体行业不断的革新和发展,在各种媒体兴起的今天,传统的广播传媒依然是媒体行业中重要的组成部分.中波广播就是人们日常生活中用收音机收听的广播频段,可以说和人们
最近几年,随着社会经济的迅猛发展、科技研究的深透和计算机网络的逐步推广,医院网络信息平台的管控变得愈来愈关键.随着信息时代的迅猛运转,医院管控不再需要大量的人力和物
本文主要对广播电视发射机的工作原理和其内部的主要部位进行阐述,明确了广播电视发射机的工作状况.并从直观法、电阻法、电压法、替换法和开路法等检测方法的检测过程,对广