适用于物联网边缘侧加速卷积神经网络的RISC--V处理器设计

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:www_acafa_com
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,卷积神经网络(Convolutional Neural Network,CNN)在物联网边缘侧设备中的图像分类、人脸识别等工程应用上取得了巨大的成功,得到广泛的应用。如今,随着CNN模型拓扑结构不断加深,以及物联网设备数量快速增长,越来越多的CNN计算任务需要下沉到边缘侧设备来执行。但是传统边缘侧设备的处理器采用的是通用型计算架构,只适用于控制任务和轻量级运算,在面对CNN这类计算密集型任务时,存在实时性差、能量效率低等问题。因此需要设计一种兼具高算力和低能耗的处理器来满足物联网边缘侧设备执行CNN算法任务的需求。
  本文聚焦物联网边缘侧设备执行CNN算法时实时性差、计算效率低等工程问题,设计并实现了一种片上扩展Winograd快速卷积算法电路架构的RISC-V处理器。面向物联网边缘侧低功耗、小面积的工程应用需求,设计了一款具有两级流水线,单发射乱序执行顺序写回结构,以及哈佛存储架构的RISC-V处理器;引入BTFN静态分支预测机制并结合旁路和阻塞策略,分别处理流水线控制冒险和数据冒险问题,以实现性能、面积和功耗的折中。同时,本文结合RISC-V的可扩展特性,以扩展指令集的方式设计并集成了一种新型的基于Winograd算法的卷积神经网络硬件加速电路,兼顾软件灵活性的基础上降低了传统卷积算法的复杂度,有效提高了处理器执行CNN任务的计算性能以及能量效率。
  本文基于VerilogHDL全正向设计了扩展Winograd卷积加速指令集的RISC-V处理器,并应用Vivado2019.1完成了处理器的功能仿真,基于XilinxArtix-7FPGA平台完成了处理器原型验证,采用华虹宏力0.13μmCMOS工艺完成了ASIC实现。最后在相同的工艺平台和约束条件下,将本文设计与开源RISC-V处理器“蜂鸟E203”在面积资源、程序运行性能等多个指标上进行比较:三维卷积程序的软硬件协同验证结果显示,本文设计的ASIC面积开销从264591.08306μm2增加到294006.9023μm2,为比较对象的111.12%;汇编程序量从1824条减少到120条,为比较对象的6.6%;程序运行时间从242.8μs减少到41.1μs,为比较对象的16.93%;能量消耗从37.634μW降低到6.5349μW,为比较对象的17.36%。数据表明,本文设计在增加一定面积开销的情况下,实现了一种兼具高算力和低能耗的处理器来满足物联网边缘侧设备执行CNN算法任务的需求。
其他文献
冰云对地球能量循环和水汽循环都有着明显的影响,因此研究冰相粒子的物理结构特性,对大气辐射传输模式、气候气象云模式和灾害天气预报等研究领域都具有重要意义。冰云中冰相粒子尺寸主要集中在20-600微米,相较于微波只能探测较大尺寸粒子、红外频段只能探测较小尺寸粒子,太赫兹频段由于其波长范围与冰相粒子尺寸分布接近,在冰云探测上具有独特优势。近二十年,国外已经对冰云太赫兹辐射特性开展了一系列研究,研制了多个
静止轨道(GEO)气象卫星相对地球基本静止的特点,赋予了静止轨道微波大气探测高频次、全天候、固定区域连续观测等优点,理论上其观测资料能有效改善数值天气预报对具有复杂多变的温湿度场、中小尺度、短生命周期的台风、流域性降水等强对流天气的预报能力。由于发展静止轨道微波辐射计面临超高空间分辨率的技术挑战,目前全球还没有实际在轨运行的静止轨道微波大气探测载荷。但是我国在规划第二代静止轨道气象卫星“风云四号”
毫米波无源探测成像系统被动接收目标场景向外辐射出的电磁波,利用不同材质的辐射差异进行成像。因其具有全天时、准全天候的工作能力,且具有无辐射、无接触、安全性高等特点,在民用和军事领域发挥着重要作用。然而原始的被动毫米波图像受噪声污染严重、细节信息缺失、分辨率低,不能满足后续做目标检测与识别等需求,影响了实际应用。通过算法对图像进行超分辨率重构可以改善图像的分辨率,然而针对被动毫米波图像这一特定的领域
综合孔径被动成像技术具有高分辨率和宽视场瞬时成像的能力,在射电天文、地球遥感、安全检查、目标探测等领域具有广阔的应用前景。综合孔径辐射计是一种基于干测量原理的多通道系统,各通道之间受限于物理参数的差异存在幅频响应不一致的问题,导致干涉测量结果(也称为可见度函数采样)的幅度、相位偏离理想值,最终影响成像质量。随着综合孔径成像技术的发展,综合孔径辐射计系统幅、相误差校正问题受到了国内外研究者的关注,现
综合孔径辐射计牺牲了设备成像结构和处理的复杂度,得到了小体积、高分辨率、实时成像速度等优点,广泛应用于现代地球科学领域。因此为了有效降低系统复杂度,本文在提出基于延时相关的综合孔径辐射测量方法的基础上,对其进行成像误差校正研究。  首先,由微波辐射信号的非相干特性,引申出延时相关综合孔径中复相关的基本二元相关器,并在此基础上推导延时相关的基本原理。从结构上分析了基于延时相关综合孔径系统中的误差类型
无线网络的广播性和便携式计算机计算性能的高速发展降低了破解对称密钥加密体系的难度。为解决这一问题研究人员提出利用无线衰落信道的随机性和互易性在合法用户之间生成对称密钥的物理层密钥生成方案。目前的研究主要集中在被动攻击下的物理层密钥生成方案设计和安全性分析,对于主动攻击下的物理层密钥生成方案研究不足。本文中我们讨论了多种主动攻击方案和应对方法,主要工作如下:  (1)回顾了物理层密钥生成方法的发展历
随着红外热成像技术的不断发展,红外热成像系统在各个行业得到了广泛应用。然而,受到工艺影响,现有的红外系统会引入大量非均匀性噪声,使得红外图像的视觉效果变差,也制约了红外图像的后期应用。当前针对红外图像的非均匀性噪声去除的方法多种多样,总体上可分为定标法和场景法两大类,其中场景法根据红外探测器拍摄的场景信息对算法校正参数进行实时调整,可以保证红外系统工作的连续性,因此逐步成为了红外图像非均匀性去除算
红外成像技术因其抗干扰性强、保密性好和全天候工作等优点在多个领域得到了广泛的应用,但由于受到大气衰减和制造工艺等因素的限制,红外图像对比度较低,难以直接用于肉眼观察,需要采用增强算法提升图像的对比度来改善可视效果。传统增强算法对提升图像的全局对比度效果较好,但是对图像的细节纹理提升能力有限,通过全局和局部增强相结合来改善全局对比度和增强细节纹理逐渐成为增强处理领域的研究热点之一。  现有的全局和局
学位
近年来,随着我国工业和城市化的发展,雾霾天气频繁出现。图像采集设备在这种恶劣条件下获取的图像通常会出现清晰度降低、信噪比降低以及图像关键信息丢失等问题,严重影响室外视觉系统效能的发挥,采用有效的方法实现图像去雾成为近年研究的重点。本文在大气散射模型的基础上,分析了雾天图像降质的原因,详细介绍了基于暗通道先验的图像去雾原理,并针对暗通道先验图像去雾的缺陷,提出了两种新的基于暗通道先验的图像去雾算法。
超材料是一种人工制造的周期性排布的复合材料,通过结构设计可以得到很多自然界材料所不具备的优异特性。近年来,太赫兹波源的出现开启了研究太赫兹波的浪潮,同时由于太赫兹波具备众多优异特性,因此太赫兹波段功能性器件的设计开发已经成为了目前研究的热门之一。但是传统材料因其本身固有的属性,很难精确的对太赫兹波产生电磁响应。超材料凭借其人工可操纵性,通过进行结构设计和参数优化,可以保证结构与电磁波的响应位于太赫