基于低精度量化的卷积神经网络在FPGA上的加速研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:lizheng124128
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着深度学习理论研究的不断深入和应用技术的不断推广,传统的卷积神经网络在语音识别、图像处理、自然语言处理等领域已经取得了巨大的成功。然而,卷积神经网络越来越大的计算规模和越来越复杂的模型结构已成为其在移动端和嵌入式端部署的瓶颈。最近的研究结果表明,经过量化后的卷积神经网络可大量减小参数规模和计算成本。在保证一定准确度的情况下,网络模型的训练过程权重和隐藏层激活二值量化为+1或者-1,量化的权重和激活值用于计算参数梯度,这样的量化操作使得内存消耗理论上减少为全精度模型的1/32。更重要地,Xnor逻辑运算和popcount位移运算可以替换原来的卷积运算,这样更是极大的减少了运算时耗。结合FPGA可编程、可重构以及低功耗的特点和二值量化的训练方法,通过Vivado HLS高级综合工具在Xilinx PYNQ-Z1轻量级开发板上对基于VGG16改进的网络进行了加速实现。从卷积层、池化层、正则归一化层、全连接层进行了相应的优化,并设计了一个矩阵向量乘法单元,通过控制调整其中的PE数量和SIMD通道数能够使模型达到局部性能最优,并最终获得整体最优性能。通过优化获得了相较于前人更高的数据吞吐量、更快的处理速度和更低的功耗。同时提供几种不同量化组合的性能对比,结果表明,量化精度越高,识别准确率越高,但是模型所需内存就越大,推理速度越慢。最后,利用本文的加速方案和量化思路实现了一个基于Squeezenet改进的目标检测网络,并获得了85.7%的准确率、31.8FPS以及2.4W的功耗。后期可根据本文方案在不同FPGA上甚至ARM端和移动GPU端部署结构更加复杂的网络模型。
其他文献
作为新政治经济学浪潮中崛起的两个经济学分支,公共选择学派和新制度经济学派的核心观点虽然大相径庭,但在对待制度变迁上却又形成了一定程度的互补,本文分别参照两派经济学家的
随着信息技术的发展,我国已经进入到了互联网时代。网络已经成为了新型的传播和沟通工具,也给传统的媒体注入了全新的活力,使其发生了较大的变化。互联网技术的不断发展正在
<正>一缘由北师大版教材四年级上册第四单元是"运算律",这是学生第一次系统学习五个运算律,即加法交换律、加法结合律、乘法交换律、乘法结合律及乘法分配律。无论在哪个数系
汉语言文学是高等教育阶段的一门重要课程,不仅可以让学生的语文素养得以提升,而且有助于我国优秀文化的传承。作为一门语言类学科,汉语言文学可以全面培养学生听、说、读、
目的通过遗传毒性研究,评价冬虫夏草西洋参复合物的毒理学安全性。方法按照Ames实验、小鼠骨髓细胞微核试验及小鼠精子畸形实验方法进行研究,并对实验结果进行判定。结果冬虫
近年来,在化学和材料科学方面,配位聚合物微米/纳米结构已经引起了人们的极大关注,这是因为它们在气体吸附、磁性、光学、分离科学、催化以及药物传送等化学研究热点领域具有
经过数十年的发展,中国保险市场已经进入了多寡头占有市场,不同保险产品市场竞争博弈的状态。如何在纷繁复杂的竞争中占据主动,在博弈过程中取得优势,已经成为了影响中国寡头
军民融合创新网络的融知效率缺失不仅影响区域创新网络中心度特征的形成和知识供应链的价值实现,还将影响创新成果的产业化过程,从而引致区域自主创新过程的整体低劣化。因此
为人设计、以人为本是当代设计理念战略发展的思想核心。无论何种形式的设计,也不论怎样入流的设计,其设计师的设计理念及设计思维、风格都被传统设计文化所影响。不论作品如
捷蜥蜴是变温卵生爬行动物,是研究卵生繁殖模式的良好实验材料。通过野外调查和实验室相结合的方法,研究高纬度条件下捷蜥蜴对环境的适应情况。主要内容包括:捷蜥蜴的生境选择、