基于FPGA的卷积神经网络手势识别系统设计

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:mobydick2000
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
手势识别作为一种更加自然、更加灵活的人机交互方式越来越受到人们的青睐。传统的手势识别方法主要依赖数学和图像处理技术,识别率底、鲁棒性差。目前,研究人员使用深度学习算法进行手势识别,该算法对图像具有平移和旋转不变性,并且对光照等影响较低,因此具有识别率高、鲁棒性好特征。但是算法的计算密集,实时性较差。在GPU(Graphics Processing Unit),ASIC(Application Specific Integrated Circuit)平台加速存在体积大、功耗高、成本高的问题,限制了其在嵌入式移动平台的使用。针对上述问题,本文在FPGA(Field Programmable Gate Array)端搭建手势识别系统,实现实时的手势识别。针对卷积神经网络计算密集型的特征,本文首先对卷积神经网络的时间复杂度和空间复杂度进行分析,通过上述分析,对已有网络模型进行修改,优化了一个能够在FPGA上实现的卷积神经网络模型。在该模型中,我们省略了卷积层中的池化操作。在分析了输出层与softmax层输出之间呈正相关关系后,省略网络的softmax层,通过比较输出层中值得大小,将输入归属为输出层中值最大所代表的类。然后在PC端使用GPU对网络进行训练,训练完成后将模型参数提取出来用于卷积神经网络在FPGA上的前项推理。针对卷积神经网络的实时性问题,本文通过对卷积神经网络算法的详细分析,充分挖掘卷积神经网络中潜在的并行性计算。其中包括图像局部感知域与卷积核进行卷积运算时的并行性;不同特征图与卷积核不同通道之间的并行性计算;网络结构中不同层之间的并行性计算。结合FPGA情况,提出对矩阵卷积运算采用全展开的方式进行加速;在不同卷积核之间提出使用流水线(PIPELINE)这种伪并行性计算的方式进行加速;对于网络中的层间并行性,采用多个层同时加速的方式加速。由于全连接层神经元数量一定,因此在FPGA上实现网络的前项推理过程中,必须对摄像头获取的1080p图像先进行缩放后才能作为网络的输入。为保证图像缩小过程中保留尽可能多的信息,本文采用双线性插值算法对图像进行缩放。最后在Xilinx Zynq-7000 SoC处理器上实现卷积神经网络模型,实验表明FPGA可以完成对卷积神经网络的加速,提高网络运行的实时性。
其他文献
施工企业是从事建筑安装工程施工的企业。工程成本是企业在施工生产中发生的各项生产耗费的货币表现。施工企业通过招投标环节中标后,建设单位和施工单位签订工程合同,确定工
近年来,随着大数据、云计算、移动互联等新兴技术在投融资、客户征信、风险管理、支付结算等多个领域的广泛应用,金融科技应运而生。金融科技的出现在提升金融服务效率的同时
为了拓宽年内展布计算法的适用范围,针对我国北方河道季节性明显的特点,对该方法进行改进。在原方法的基础上,将同期均值比修改为特枯年( P =90%)河道年径流量与多年平均径流量的
耕地资源是人类赖以生存和发展的重要物质基础,近来来,伴随着人口的急剧增长和环境的恶化,耕地的面积和质量状况受到了严重威胁。摸清耕地底数,掌握耕地质量现状,实现科学合
以菠萝(Ananas comosus)’神湾’品种为材料,采用石蜡切片法对其愈伤组织中球形胚形成过程进行了组织细胞学观察。结果表明,非胚性愈伤组织转入到MS+4.0mg·L-12,4-D+0.5mg·
本文通过传播的仪式观的角度对《人民日报》近五年(2013年至2017年)的头版进行分析,从而研究以《人民日报》为代表的党报的仪式传播。《人民日报》作为中国共产党中央委员会
余热锅炉在运行过程中经常出现受热面积灰、受热面磨损和省煤器腐蚀等问题,严重影响了余热锅炉的安全、稳定运行。分析了受热面积灰、磨损及省煤器腐蚀的产生原因与危害,结合
目的探讨与观察宫外孕大出血中采用整体护理干预的临床效果。方法自2013年1月至2014年9月,于我院收治的86例诊断为宫外孕发生大出血情况的患者,以数字法随机分成观察组(43例)
近年来,绛县纪委、监察局对86名县、乡两级纪检监察干部进行了交流,其中系统内交流60人,系统外交流26人,激发了纪检监察队伍活力,为全面落实科学发展观,构建和谐绛县,推进党
随着社会的不断发展,高层建越来越多,且越来越高,与此相对应的,扑救高层建筑火灾的举高车便显得尤为重要。为有效地发挥好举高消防车在扑救高层建筑火灾中的作用,现就影响举