【摘 要】
:
现有软件实现方案难以满足卷积神经网络对运算性能与功耗的要求。为此,设计一种基于现场可编程门阵列(FPGA)的卷积神经网络加速器。在粗粒度并行层面对卷积运算单元进行并行
【机 构】
:
浙江大学电气工程学院,杭州电子科技大学电子信息学院
论文部分内容阅读
现有软件实现方案难以满足卷积神经网络对运算性能与功耗的要求。为此,设计一种基于现场可编程门阵列(FPGA)的卷积神经网络加速器。在粗粒度并行层面对卷积运算单元进行并行化加速,并使用流水线实现完整单层运算过程,使单个时钟周期能够完成20次乘累加,从而提升运算效率。针对MNIST手写数字字符识别的实验结果表明,在75 MHz的工作频率下,该加速器可使FPGA峰值运算速度达到0.676 GMAC/s,相较通用CPU平台实现4倍加速,而功耗仅为其2.68%。
其他文献
人才是高校生存和发展的最基本、最重要的条件。作为人才兴校、人才强校的一种重要手段,高校之间人才竞争日益激烈,人才流失现象也日益突出。尤其是西部医学院校在人才流失问
炭疽杆菌的分离培养.对人类皮肤炭疽的渗出液、血液、脑脊液、痰等标本,一般按常规法直接划种子血平板上分离培养,而动物皮毛、土壤、粪便等外环境污染标本才进行增菌,除杂菌
氯胺酮基础麻醉下行臂丛阻滞是小儿上肢手术常用的麻醉方法。我院自2005年元月以来在氯胺酮基础麻醉加臂丛阻滞下实施小儿上肢手术97例,麻醉效果满意,现报告如下。1资料与方
<正>设计说明:IL Pavone从上世纪70年代设计风格中提取重要的复古元素,注重宽带的交错设计和凉鞋熟练工艺相结合。铆钉配件使用而富有装饰性;宽大的加厚鞋底,与倒置的锥形鞋
主动脉夹层(aortic dissection AD)旧称主动脉夹层动脉瘤,系指内因或外力作用下主动脉壁内膜破裂,血液通过内膜口渗入主动脉壁的中层而形成血肿,血肿沿主动脉壁中层延伸剥离,并
口腔正畸治疗中常遇到年轻患者的前牙缺失和埋伏阻生,把错位埋伏的恒牙拔出后在正常的牙槽位置进行移植,以取得更好的外观和功能的恢复。我科于2005-2007年使用牙种植系统进行