卷积神经网络的全可编程SOC实现

来源 :云南大学 | 被引量 : 0次 | 上传用户:sky011
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
最近几年,卷积神经网络(Convolutional Neural Network,CNN)在一些应用领域取得了很大的成功,特别在计算机视觉方面,它有着广泛的应用。随着物联网技术的发展,越来越多的设备需要捕捉图片或视频,市场对具有高精度和实时目标识别功能的嵌入式系统有很大的需求,比如无人驾驶汽车和机器人视觉等。然而,卷积神经网络是一种计算密集型和资源消耗型的方法,因为功耗和资源的限制,它很难被集成到嵌入式系统内,例如手机、智能眼镜和机器人等。FPGA是一种最为理想的提高卷积神经网络运算速度的平台,它具有高性能、可定制、功耗低和开发周期短等优势。Zynq全可编程SoC集成了双核ARM Cortex-A9多核处理器和可编程逻辑,为算法的实现提供了很大的灵活性和优异的性能表现。为了将卷积神经网络实现到嵌入式系统中,本文研究了基于Zynq平台实现卷积神经网络的方法,并与其它硬件平台进行比较。本文的研究内容有:1、Zynq芯片的结构和基于Zynq平台的设计流程。2、CNN内存在的并行特性和并行特性实现方法。3、根据并行特性设计硬件加速器结构,并根据特定的CNN对其进行优化。4、CNN加速器的RTL级设计。5、在Zynq平台上通过软硬件协同方式实现CNN。本文最后进行了实验对比。首先,将本设计与通用计算机和双核Cortex-A9处理器作比较,结果显示:有硬件加速时,Zynq平台的性能功耗比为48 images/Joule,分别是双核Cortex-A9处理器、台式机和笔记本电脑在纯CPU运行时的8倍、16倍和9.6倍。其次,与其它高性能CNN加速器比较,虽然没有达到更高的单位性能,但是本设计具有很大的价格优势。最后,根据对比结果,本设计能以低成本的硬件平台实现CNN,并且可以达到很高的性能功耗比,能满足嵌入式系统低功耗和低成本的需求。
其他文献
近些年,由于部分家长的盲目的从众心理,一些商家的利欲熏心加上家长没有正确理解儿童美术教育,使得儿童美术教育趋于模式化、成人化、商业化等。鉴于此,本文从当前儿童美术教
文章针对近年来我国海域无证滥采海砂问题及其所造成的后果,提出了海砂开采管理监督的八项措施,主要是明确责任、依法管理和收费,严格控制开采规模和开采量,规范开采秩序,严
青年编辑是科技期刊编辑队伍中的重要群体,是建设世界一流科技期刊的主要力量。信息技术与编辑出版的深度融合对编辑人员的学习能力提出了更高要求,青年编辑如果能强化信息整
根据汽车制动系统和轮胎的典型故障模式分别建立了故障树,利用D-S理论中的似然函数和信任函数分别作为故障树分析底事件发生故障概率区间的上、下界。采用区间分析理论,分别
<正>一、国外廉政建设主要举措(一)详尽的公职人员廉政义务规范近几十年来,国外很多国家为了保证公职人员的权力行为合乎公共性的要求,防止权力被掌权人滥用,都规定了明确的
<正>多发性硬化(multiple sclerosis,MS)是常见中枢神经系统疾病,以白质炎性脱髓鞘病灶、胶质瘢痕形成及轴索损伤为特点,被认为是针对髓磷脂抗原的自身免疫反应性疾病。自上
目的分析成分输血引起输血不良反应的原因,探讨降低输血不良反应发生的措施,保障临床输血安全。方法回顾本院2012年1月至2014年12月57 171例患者输注血液制品的临床资料和《
针对滚动轴承故障微弱信号特征识别问题,提出一种非抽样运算的自适应冗余提升小波包诊断方法,解决了传统的小波包或提升小波变换进行抽样运算造成故障信息失真问题。该方法以
<正>习近平总书记在党的十八届三中全会上指出:"国家治理体系和治理能力是一个国家制度和制度执行能力的集中体现",并对"国家治理体系和治理能力现代化"相关概念及二者的相互
长余辉发光材料是一种蓄光节能的绿色环保材料,在标识物、日用工艺品等广泛应用。发光性能优异、化学性能稳定、绿色环保、制造成本低成为衡量长于辉发光材料的重要指标。磷