基于FPGA嵌入式平台的高能效CNN应用系统

来源 :清华大学 | 被引量 : 0次 | 上传用户:jinn
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近几年来,人工智能进入了如火如荼的发展时期。深度学习领域的算法在不断推陈出新的同时,其功能和适用性也在一直扩展并且应用在各种实际场景中,包括计算机视觉、自然语言处理、智能驾驶、智能医疗和智能安防等领域。但是,随着人们对人工智能设备功能和性能上的需求不断增加,传统的GPU、CPU等计算平台无法满足实际应用高能效、小体积和低成本的要求,需要更多的解决方案。本文根据卷积神经网络(Convolutional Neural Network,CNN)计算密度高、数据规模大的特点,研究了“可编程片上系统(System on Programmable Chip,SOPC)”的嵌入式设计方法,充分发挥硬件高性能和软件灵活性两方面的优势,提出了软硬件结合的高能效CNN应用系统实现方案。主要研究内容如下:首先,本文在硬件电路中实现了卷积神经网络中最为关键的几个模块,并针对各模块的运算特点做了相应的优化。对卷积层,利用循环分块和交换、并行化、复用等策略,设计了FPGA片上并行化的计算架构和流水线的计算单元。并利用层次化和乒乓策略,设计了与计算架构相配合的“多维存储映射”缓存方案和“双缓冲缓存”的数据传输方案。对池化层,设计了“并转串”的比较计算结构。对激活层,针对不同的激活函数,分别采用并优化了查找表映射或分段线性拟合的设计方案。其次,本文将可配置的Nios Ⅱ软核嵌入到FPGA中,将CNN计算中的部分环节交由Nios Ⅱ核处理。Nios Ⅱ核中不仅实现了图像的获取和预处理功能,还设计了软件代码以控制系统的计算流程,同时利用丰富的外设接口与外部设备进行通信。除此之外,本文结合DMA控制器、Avalon总线和各种存储结构,设计了片内和片外存储之间高速稳定的数据传输路径。最后,本文在Altera公司的FPGA上实现了软硬件协同工作的CNN嵌入式系统,改进并训练了YOLO目标检测模型,识别精度为96.74%,进而在系统中实现了该网络的CNN部分。在完成系统运行过程中几个关键节点测试的基础上,结合网络的原始C模型验证了整个系统的功能正确性。在性能方面,本系统在Stratix V平台上以180MHz的工作频率可以达到最高峰值吞吐率89.28GOPS。而在Cyclone IV平台上的功耗仅为1.35W,能效最高可以达到44.09GOPS/W。
其他文献
精准扶贫是我国在反贫困工作进入新的历史阶段后采取的新举措。自精准扶贫政策实施以来,学界对其进行了丰富的研究。精准扶贫政策极大的克服了以往扶贫工作中出现的执行低效
本篇文章重点针对GIS(地理信息系统)的功能以及其在燃气行业中的信息系统的管控、管网的设计和运行与管道施工等方面的应用进行了探析,以期提升我国燃气管网的运营效率。
目前有很多降解染料废水的技术已趋于成熟,主要有凝结法、膜过滤法、沉淀法、氧化技术。本论文对亚甲基蓝和甲基橙溶液进行了降解。实验探究主要分为三部分:超声单独降解有机
评价是探究学习过程不可缺少的一部分,科学探究学习目标的多元化需要建立起一种能够激励和促进学生知识与技能、过程与方法、情感态度与价值观协调发展的评价理念:评价的方式
背景和目的 胆囊肿瘤是危害人民身体健康的主要疾病之一,在腹部外科中占有极重要的地位。胆道恶性肿瘤在我国消化道肿瘤中居于第5位。每年约有4500人死于胆道肿瘤。由于胆
卵巢癌是妇科三大恶性肿瘤之一,起病隐匿、恶性度高,完善的肿瘤细胞减灭术和术后辅以铂类为主的一线化疗是当前治疗卵巢癌的主要手段。但由于一线化疗后顺铂耐药的存在造成卵巢
幼儿的英语教育方法和实践一直是教育界的一个热门话题。本文重点分析了音乐教育在幼儿英语教学中存在的问题,并提出改进音乐教学提高幼儿英语教学水平的具体应用方法,希望在
目的总结定期自行脱落胆道支架在腹腔镜胆总管探查术中的应用效果、适应证及操作方法。方法应用吸收线和聚氨酯导管制成定期自行脱落J型胆道支架。在胆总管切开清除结石后,将
目前,以大容量、高温高压为基本特征的超临界、超超临界直流锅炉被广泛采用,相应地,更加复杂的热力系统结构和更精准的操作要求需要现场运行人员有相当的知识储备和过硬的操
一以创作“乡土童话系列”闻名全国的皖籍作家杨老黑于今年六月由中国少年儿童新闻出版总社、中国少年儿童出版社联合出版了《杨老黑少年侦探系列》(四部)。在中国儿童文学文