基于FPGA加速器的CNN-SISA指令架构研究与实现

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:sk01230147
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近些年来卷积神经网络广泛应用于航天背景下在轨实时目标检测,同时FPGA由于其低功耗、高并行的特点,成为航天领域卷积神经网络算法最理想的载体。但随着深度卷积神经网络的发展,模型计算量参数量日益增长,FPGA有限的资源成为深度卷积神经网络部署的瓶颈。本文以此为切入点,参照超长指令字架构的设计思路,提出了基于FPGA的卷积神经网络算子复用式指令架构CNN-SISA,实现了资源的缩减及效率的提升,主要工作包括:(1)为提高加速器对卷积神经网络模型的适应性,本文根据卷积神经网络和FPGA的特点设计了CNN-SISA指令编码。指令编码的设计采用粗粒度控制模式,以控制FPGA端算子模块为目标,通过分析当前主流卷积神经网络的算子构成,将指令编码按功能分为数据搬运指令、控制指令、运算指令和状态指令四类,并对指令中每个字段的控制信息、字段位宽进行定义。(2)为完成卷积神经网络参数信息到指令码流的映射,本文设计了CNN-SISA指令汇编器。出于通用性的考虑,指令汇编器兼容当前主流卷积神经网络框架,可自动完成Caffe模型描述文件解析,并配合指令生成算法完成指令字段填充。指令完成构建后存储于本地COE文件中,通过PCI-e传输或指令ROM重写的方式来实现FPGA上不同卷积神经网络指令集的替换。(3)为完成指令码流到FPGA端微操作的映射,本文设计了CNN-SISA指令处理器。指令处理器由指令寄存器、指令译码器构成,按执行流程可分为取指、译码、访存、执行、写回。在指令处理器和算子模块交互中设计了一种三次握手模式,保证交互的可靠性。并从流运算和模块并行两方面完成了FPGA上卷积阵列设计,设计符合卷积运算特征,可实现不同通道、不同位置运算的并行操作,契合FPGA并行运算的特性。(4)以YOLOv3-Tiny算法为例,对CNN-SISA指令架构验证系统进行构建。完成YOLOv3-Tiny网络生成、训练、指令生成及网络量化工作,并将实测结果从资源、时序、功耗、正确性、计算效率及指令编码效率与多个工作进行对比,突出CNN-SISA指令架构的优势。CNN-SISA指令架构可将16位量化方案下的YOLOv3-Tiny算法资源缩减至原来的38%,同时计算资源的使用率可达到92%,指令密度也可达到24.27 GOP/MB,优于其他工作。综上所述,本文设计的CNN-SISA指令架构可以有效完成航天背景下基于FPGA的卷积神经网络开发,解决了目前较为棘手的资源限制问题,并在通用性和性能上有良好保证。
其他文献
增量学习是人工智能领域的重要研究方向之一,旨在让模型在不重复学习先前数据的情况下持续学习多个任务。随着人工智能技术的快速发展,增量学习逐渐成为智能算法应用在实际场景中的驱动力,引起工业界和学术界的广泛关注。虽然增量学习已经取得了长足进步,智能算法能够以较小的计算和内存代价持续学习多个任务并取得较好的结果,但在实际场景的应用方面仍然面临诸多需要解决的理论问题和关键技术,如增量学习中固有的灾难性遗忘问
学位
随着社交网络的逐步兴起,随着多媒体技术的高速发展,图像已经成为日常生活中人们表达自我和理解他人的重要媒介。目前,大多数计算机视觉任务都集中在教会机器像人类一样“看”,很少关注机器如何才能像人类一样“感受”,而认识人类情感是通向强人工智能的必经之路。由此,图像情感分析应运而生,主要目的是理解人类对不同视觉信息产生的情感体验。作为计算机视觉领域的重要课题,图像情感分析的进展将会推动相关领域的研究(如图
学位
近年来,我国加大了对高污染企业的整顿,“十四五”规划中专门提出了4.6亿吨焦化产能清洁生产改造工程计划。K焦化公司近几年在环保方面加大了整改力度,环境成本逐年上涨,但公司目前仍未将环境成本单独核算,且环境成本的确认范围不全面,不利于为管理层提供详细的环境决策信息。在K焦化公司的环境成本核算中引入MFCA,可以将环境成本核算与生产过程紧密联系,单独核算环境成本,推进公司的清洁生产改革。本文基于环境成
学位
目的 构建首个认知域信息传播的动力学理论模型以推动认知域信息攻防的体系建立,并利用仿真数学模型进行概念验证。方法 在理论构念上提出认知域信息传播的核心-易感-感染-康复传播动力学模型(Hub-Susceptible-Infected-Recovery, HSIR),基于龙格-库塔法的非线性积分方程进行模型仿真验证。结果 标准HSIR模型的仿真结果显示,认知域信息在1万人的群体中传播,将在第46天达
期刊
在碳减排的大环境下,大力发展再生能源对实现“双碳”目标具有十分重要的意义,而再生能源最大的消费主力之一就是电动汽车。电动汽车的核心之一是电池管理系统(Battery Management System,BMS),BMS主要的作用就是实时监控汽车的行驶状态,但目前BMS仍有不足,存在精度低、体积大等问题。由于锂电池估测系统对汽车行驶安全至关重要,因此开发了精度更高、体积更小的锂电池估测系统。论文研究
学位
随着计算机与互联网技术的深入发展,人类生活与互联网的结合愈发紧密。在这一态势下,计算机和互联网系统的安全性对于人类生活生产的稳定运行极其重要。然而自计算机软件诞生以来,代码漏洞就在影响着软件和系统的安全稳定。如何在软件开发和编译阶段就对代码漏洞进行检测,是软件技术发展中的关键环节。Go语言是一种兼具python的快捷开发特性和C语言的高性能和高安全性等特征的语言。Go语言的使用过程中同样有代码漏洞
学位
对于监控场景来说,摄像机的运动、环境光照等因素的变化相对可控,而物体剧烈运动是引起模糊核突变的主要原因。传统动态场景去模糊的方法都基于相邻帧之间的位移较小,适用于处理平滑变化的模糊核。而动态场景中通常包含多个运动物体,很容易发生模糊核突变的情况,在由粗到精的框架内传播时,模糊核突变会导致重构误差。本文针对双向光流去模糊方法中存在的微小结构重构失误导致伪影的现象,提出了一种对多尺度金字塔进行分层处理
学位
针对当前基于知识图谱的推荐模型没有充分挖掘知识图谱语义结构信息的问题,提出一种融合知识图谱表示学习方法和信息协同传播机制的推荐模型KCOD。KCOD基于经典的知识图谱表示学习模型DistMult与TransR建模并推理实体三元组的语义关系,然后通过交叉计算每一阶历史交互实体向量推理结果与候选物品实体向量推理结果的相似度,进行模型训练及偏好预测。实验结果显示KCOD的性能优于经典对比模型。
期刊
社交平台信息发布和获取的便捷性,方便了人们的沟通交流,但是也给谣言的产生和传播提供了肥沃的土壤。谣言一般产生于人们普遍关注的热点领域,极易引发各类不安定事件,影响社会和谐稳定。建立谣言传播模型,探究谣言传播影响因素,有助于治理谣言。现有的研究很少考虑到空间因素对谣言传播的影响、初始传播者不同的影响力以及通过优化网络结构治理谣言问题。借助分形理论,可以使谣言传播模型的研究更加完善。本文利用分形理论的
学位
互联网时代的到来,对人们的生活方式和思维观念产生了颠覆式的影响。同时也使传统行业发生了巨大的改变。计算广告因其得天独厚的优势,成为广告主要的投放模式,和传统的媒介不同,计算广告采用大数据和机器学习的相关技术,实现广告的精准投放,达到千人千面的个性化推荐效果。计算广告领域的核心问题是准确地预测用户对待预测商品的点击率,一个性能优秀的点击率预估模型不仅能为商家和平台增加收益,同时也能改善用户的体验。早
学位