【摘 要】
:
随着现代处理器集成晶体管数量的不断增加,处理器性能的进一步提高越来越受限于能耗与散热之间的矛盾。另一方面,对于采用电池供电的移动终端类应用和对能耗更加敏感的物联网应用,如何在满足性能需求的前提下尽可能的降低能耗已经成为设计者首先需要面对的挑战。为了降低系统的能耗以减缓上述矛盾,工业界和学术界将电路的工作电压向下延伸至近阈值附近。然而在近阈值低电压工作环境下,组成系统中高速缓存(Cache)的主体:
论文部分内容阅读
随着现代处理器集成晶体管数量的不断增加,处理器性能的进一步提高越来越受限于能耗与散热之间的矛盾。另一方面,对于采用电池供电的移动终端类应用和对能耗更加敏感的物联网应用,如何在满足性能需求的前提下尽可能的降低能耗已经成为设计者首先需要面对的挑战。为了降低系统的能耗以减缓上述矛盾,工业界和学术界将电路的工作电压向下延伸至近阈值附近。然而在近阈值低电压工作环境下,组成系统中高速缓存(Cache)的主体:静态随机存储器(SRAM)阵列中的部分存储单元(Bitcell)在位线(Bitline)放电结束后两根位线之间的压差无法在规定时间内达到对应敏感放大器的失调电压,这种时序错误的发生导致数据无法正确地被敏感放大器采样,从而劣化整个系统的性能。时序推测技术可以通过对数据进行多次采样以检测时序错误并通过延长位线放电时间将其纠正,本论文基于交叉感知型时序推测SRAM(CS-SRAM)提出了一种时序推测Cache(TS Cache)。直接使用时序推测型CS-SRAM阵列构建的TS Cache设计虽然可以检测并纠正由于电压降低而带来的时序错误,但修复这些错误所依赖的额外位线放电延时会对整体系统性能带来负面影响。为此,本论文在此基础上提出了基于重用的重映射时序推测Cache(RRS Cache)优化设计以缓解低电压工作环境下TS Cache性能较低的问题。RRS Cache中提出的优化机制包括:第一,Cache行(Cacheline)重映射机制尽可能的将时序错误集中映射到少数Cache行中,从而减少Cache中受到时序错误影响的Cache行数量;第二,基于重用的Cache填充替换策略。该策略以读请求在系统中有更高的重要性为根据,优先将无错资源分配给有较高可能性被读请求所重用的数据,从而进一步降低读访问遇到时序错误的几率。本文对八种不同的近阈值Cache方案进行性能、面积、功耗等多方面的横向对比。与TS Cache设计方案相比,RRS L1 Cache的额外功耗上升了0.2%,面积增加了1.76%,而其访问平均延时降低9.8%;RRS L2 Cache的额外功耗则下降了13.5%,面积上升了2.54%,访问延时降低9.4%;此外RRS Cahce整体系统的性能较TS Cache提升9.8%,达到了理想Cache方案(无任何时序错误)性能的98.6%,同时也是剩余的七种方案中性能最高的Cache方案。
其他文献
随着软件工程技术迅猛发展,软件规模也日益庞大,消除软件缺陷成为软件工程中一项极为繁重的任务。软件调试就是定位并解决软件缺陷的过程。为了保证复杂的软件系统稳定运行,研发人员需要对系统各功能进行详细调试,调试工作会占用大量项目时间。当遇到无法在本地启动程序、没有项目源代码、程序错误不在本地等情况,研发人员需要远程调试程序。传统的远程调试工具都是将源代码下载到本地再编译,既无法还原错误现场,也不能适应无
随着人们对智慧城市,智慧安防的需求越来越大,智能视频技术不断发展,行为识别技术在智能视频系统中不可或缺。目前的行为识别算法难以在较低算法复杂性的条件下实现高识别率,所以本文主要研究与设计低运算量、高准确率的行为识别算法,并完成基于FPGA的算法硬件验证。本文首先对不同算法结构的性能进行对比与分析,选择低运算量而准确率相对较高的Res Net-50+LSTM算法结构,识别准确率为79.10%。为了进
近年来,随着信息交互过程中数据安全问题的出现,设备指纹识别技术开始被应用。仲裁器物理不可克隆函数(Arbiter Physically Unclonable Functions,APUFs)利用IC制造过程中不同工艺偏差对逻辑门传输速率的影响,为每个芯片产生特定的“芯片指纹”,主要应用于芯片身份识别、设备认证等领域。由于现场可编程门阵列(Field Programmable Gate Array,
随着物联网技术的快速发展,信息加密技术显得越来越重要。信息加密通过软件或硬件实现,基于硬件实现的密码芯片具有速度快,功耗低的优势,已成为研究热点。然而基于硬件实现的密码芯片易受到功耗分析攻击等侧信道攻击,它是一种非侵入式攻击,攻击者通过获取大量密码设备在加、解密操作时泄露的功耗信息分析出密钥信息。本文研究了高级加密标准(AES)算法的功耗分析攻击和抗功耗分析攻击方案。为了提高侧信道攻击的效率,降低
5G技术与物联网技术的发展使得低功耗无线收发系统成为研究的热点,而射频接收前端作为射频接收链路中的关键模块,其性能在很大程度上决定了整个射频接收链路的性能,且其同样也是主要的耗能模块。因此,在保证射频接收前端性能的前提下降低其功耗至关重要,具有重要的科研价值与工程意义。本文设计了一款面向IoT的低功耗射频接收前端,在实现了低功耗设计的同时得到了低的噪声系数与高的转换增益,确保射频接收机高灵敏度的实
窄带物联网(NB-IoT)技术作为物联网系统中的一个最重要研究方向,受到人们越来越多的关注。NB-IoT的核心功能由3GPP R13标准定义,在之后的升级版本中进行了补充。通过软件仿真,可在实际部署系统之前对相关协议与算法进行验证和性能评估,提前发现问题并解决。本文基于3GPP R13标准,针对NB-IoT系统的协议栈进行软件仿真平台研究与实现。本文首先对NB-IoT系统进行概述,对数据在NB-I
近年来,人工智能越来越受到关注,为了使人们的生活更加便利,各种智能设备应运而生,未来智能设备的市场很大,社会对于物联网设备的需求也将急剧增加。在用于物联网的各种通信技术中,窄带物联网(NB-IoT)以其大连接、广覆盖等特点脱颖而出。NB-IoT是针对新型物联网业务提出的一种新的蜂窝网技术,继承自长期演进技术(LTE),与LTE有许多相似之处,但同时也有很大的不同。在NB-IoT中,随机接入是实现上
近年来,物联网技术的应用越来越广泛,而终端用户量巨大,多采用电池供电,长期更换电池会造成大量人力物力的浪费,所以,降低终端能耗迫在眉睫。本文依据3GPP中R13标准的相关规定,对窄带物联网NB-Io T低功耗技术进行研究。本文首先针对终端同时响应,造成信道堵塞且能耗浪费的问题,提出了基于分组的周期自适应调整的策略。各终端设备先按照各自的应用进行自动分类,系统按照所分类别配置相应的参数。设备随后通过
在经济全球化和市场经济竞争日趋激烈的背景下,前瞻的战略和强大的执行力已成为国有企业提升市场竞争力的关键。但目前一些国有企业在执行力动力方面、执行力领导方面、执行力行为方面等还存在不足,在执行管理中缺乏模型指导及信息技术的支持。本文针对目前一类国有企业执行力普遍存在的现状,设计和实现一个执行力管理系统。本文结合拉里博西迪典型的执行力模型和企业实际,设计了针对任务执行的执行力模型,确定了模型组成要素,
利用物理不可克隆函数(Physically Unclonable Functions,PUF),可以提取设备独有的安全信息,并作为物理指纹,用于安全认证等应用。PUF由于其可被实时读取,具备不可预测和不可克隆的特征,成为了近年来硬件信息安全领域的一个热门话题。其中动态随机存储器PUF(Dynamic Random Access Memory PUF,DRAM PUF)作为一种可应用于嵌入式设备的内