基于RISC-V处理器的卷积神经网络加速SoC

来源 :吉林大学 | 被引量 : 0次 | 上传用户:xqdd520cn
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着处理器性能的快速发展以及存储器容量的不断提升,模拟人体大脑的神经网络算法成为了目前最流行的算法。该算法在很多领域表现出比传统算法更优越的性能,例如在网页搜索,图像分析,语音识别等方面。卷积神经网络(CNN)是针对图像分析所提出的一种神经网络算法,在2012年的Image-Net LargeScale Vision Recognition Challenge(ILSVRC)中,卷积神经网络算法击败传统图像算法获得第一名;2018年,在围棋领域,依靠卷积神经网络算法的AlphaGo击败了李世石,展现了卷积神经网络算法强大的潜力。但是,由于卷积神经网络参数多,运算量大,目前,该算法大多数情况下依赖图形处理器(GPU)进行运算。GPU虽然运算快,但是功耗较大,并不适合在嵌入式领域中应用,并且随着摩尔定律的失效,将神经网络算法移植到硬件实现的期望也越来越迫切。现场可编程门阵列(FPGA)具有更为灵活的硬件实现和比GPU更低的功耗,非常适合作为卷积神经网络的一种硬件实现设计。在实现方面,基于处理器和加速器外设实现的片上系统(SoC)与单纯使用加速器相比更具有灵活性。本文致力于实现一款低功耗,高性能功耗比的神经网络加速SoC,它不同于大多数SoC设计采用ARM硬核作为处理器,而是通过专门设计的低功耗RISCV处理器—Jearcore控制系统工作。RISC-V指令集为美国加利福尼亚大学伯克利分校计算机科学部为了学术研究创作出来的开源指令集。相比于ARM等商业指令集,其不但不需要高昂的授权费用,在结构上也更便于用硬件实现,较少的硬件实现决定了使用该指令集制作的处理器功耗更低,便于应用在嵌入式系统中。本文制作的加速SoC结构设计流程如下,首先利用高级语言仿真RISC-V处理器的行为,并以此为基础,搭建了五级流水线模型,解决处理器内部的指令冲突问题。为进一步提高处理器的性能,本文依次为处理器添加静态指令预测器,中断处理单元,乘除法器以及紧耦合寄存器。最终版处理器Dhrystone性能测试结果为1.501720 DMIPS/MHz,Coremark性能测试结果为3.350980 CoreMark/MHz。随后使用Vivado软件制作单个加速器外设模块,通过Vivado仿真软件完成其行为级的验证和仿真。在需要多个加速器同时工作的情况下,本文采用了多个加速外设级联的方式,实现了根据需求使用任意数量的加速器的同时,有效的减少了单个加速器使用的浮定点数转换模块和DMA数量,从而降低了功耗。最终,以Jearcore为基础,AXI为总线,通过Vivado的Block Design功能,连接了必要的GPIO、UART、摄像头驱动模块、HDMI模块、加速器模块等多个外设,并移植FatFS文件系统,实现了摄像头和SD卡两种图像输入方式。在参数方面,由Tensorflow生成神经网络参数,存储为二进制格式文件,并输出描述神经网络结构的Json文件,以供SoC系统读取。本文最终在NexysVideo开发板上验证,测试数据集为Mnist数据集,除浮点数转定点数带来的准确率损失(0.06%)外,并未引入新的错误。运行速度比单独使用Jearcore提升了6,865倍,功耗为1.274W,性能功耗比为1.658GPOS/W,高于目前常见的I5-9400f CPU和NVDIA GTX 1060GPU。实现了SoC的预期设计目标,达到了高性能功耗比和低功耗的要求。
其他文献
<正>大教育家朱熹,一生从事书院教育,门徒众多,尤其是他在信州书院开展的讲学著述活动,对信州理学与教育产生了重大影响。本文通过整理朱熹在上饶书院开展的教育活动,分析了
会议
本文首先对南加州大学Paicni博士提出的自适应模糊跳频技术进行了详尽的论述,在文章的最后对模糊跳频技术的发展提出了几点看法。
采用有限元/有限差分法对薄壁制品注射成型充模阶段的流动进行了数值模拟,得到温度场、速度场及压力场分布;并结合实验结果进行了分析,得到了一些结论.为整个充模过程的控制
中国轻工机械协会第三届理事会2008年常务理事(扩大)会议于2008年1月12日在杭州举行。参加会议的领导有国家发展与改革委员会工业司李平处长、中国轻工业联合会综合业务部李宽
微孔塑料的成型方法主要包括间歇成型法、连续挤出成型法、注射成型法和相分离法等,并且各有优缺点.其中,连续挤出成型法及注射成型法适合工业化生产.分析了微孔塑料的成型过
先讨论了冲击载荷对构件寿命的影响,然后从四杆机构的二阶传动函数的分析中,得出了从动件在两极限位置时,加速度为零的一类传动机构的设计原理。依此原理提出了从动件在两极限位
本文介绍航标遥测遥控系统的组成,重点叙述航标数据的采集、传输、分析与显示.
2005年11月15日至16日,2005年度中国轻工业联合会行业协(学)会工作论坛在北京召开。本次论坛的主题是:做好盥对服务,维护产业安全。重点结合我国当前轻工业出口形势,交流“两反一保
介绍了软件无线电的概念、组成和特点;分析了研究软件无线电信息处理的意义及可行性;阐述了面向对象的方法;将面向对象的方法与软件无线电的设计思想相结合,提出了应用于防空
以摆动从动件盘形凸轮机构为例,介绍了参数化的凸轮设计方法,同时利用VB对AutoCAD二次开发技术,将凸轮的设计计算、运动分析、三维模型建立及运动仿真融为一体,极大地提高了