面向CNN的高能效SRAM计算阵列的研究与实现

来源 :东南大学 | 被引量 : 1次 | 上传用户：zuochangfeng

【摘要】

：

【作者】

：

刘炎

【出处】

：

东南大学

【发表日期】

：

2019年01期

【关键词】

：

卷积神经网络静态随机存取存储器存内计算时域高能效

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

卷积神经网络(Convolutional Neural Networks,CNN)在视觉感知领域取得了优秀的识别效果,彻底改变了传统计算机的视觉框架。然而,受限于存储器带宽瓶颈及计算功耗问题,CNN在移动物联网端的应用举步维艰。因此,如何突破存储器的限制,实现高能效的卷积计算具有重要意义。其中一个思路是使用二值网络降低计算的数据量,从而减少功耗开销。此外,存内计算(Computing In Memory,CIM)突破传统的冯·诺伊曼架构,在高能效计算领域展示出得天独厚的优势。为解决访存与计算功耗问题,本文基于课题组在静态随机存取存储器(Static Random Access Memory,SRAM)方面的研究经验,设计了一款面向CNN的高能效SRAM计算阵列。该阵列兼顾了卷积计算模式和SRAM存储器模式,将计算单元嵌入SRAM阵列,实现脉冲调制计算的CIM架构,同时大幅度降低访存与计算开销。此外,针对脉冲信号的量化问题,本文设计了一种基于时域累加的并行量化器,量化器采用先累加再量化的方式,消除了多行脉冲独立量化带来的误差累积。最后,本方案从卷积核分解,权重载入,特征值自适应计算三个方面,进一步降低了访存与计算。本方案在TSMC 28nm HPC+工艺下,完成了电路设计与版图实现,并提交流片。SRAM计算阵列的大小为896*224比特,后仿真结果表明,在TT工艺角25℃0.9V,主频500MHz情况下,SRAM模式的写良率达到100%,满足设计需求;计算模式下,以权重二值化的AlexNet为基准,取得了39.03Tops/W的高能效(后仿真结果),是同类型数字架构的17.74x和1.96x(对比对象为实测结果),同时与其他CIM架构相比,本方案的优势在于拥有更高的灵活性,可以实现更高精度的网络。

其他文献

黄花鱼，这时最宜

商场速冻产品的柜台里，各种各样的鱼一年四季一应俱全，人们在挑选的时候大多从口味和自己的爱好考虑，有一个重要的原则却被忽视了：吃鱼有季节性。应该说，临近产卵期的鱼最好吃，目前正是大黄花鱼、小黄花鱼、鲐鱼、鲅鱼以及三文鱼和多宝鱼的产卵期，因此夏天最适宜吃这几种鱼。　　不同的鱼有不同的产卵期，分布在不同的季节。鱼在临近产卵期时，体内积蓄了很多脂肪和营养成分，身体肥硕而结实，因此肉的味道最鲜美，吃起来有种

期刊

黄花鱼谷氨酸夏季营养价值

斜向预应力混凝土路面施工技术

对预应力混凝土技术和研究现状分别进行了阐述,针对斜向预应力混凝土路面的施工技术,从路面材料和施工设备的选择、施工工艺等方面进行了详细的介绍和说明,可为同类施工提供

期刊

混凝土路面斜向预应力施工设备施工工艺

试论电动机的多功能保护

对三相异步电动机的保护,可以充分发挥其过载能力而又免于损坏,同时提高电力拖动系统的可靠性和生产的连继性.其中电子式多功能保护器是比较好的一种保护装置.

期刊

电动机多功能保护缺相过载

面向CNN的高能效SRAM计算阵列的研究与实现

其他学术论文