【摘 要】
:
表情识别指利用计算机提取人脸表情特征进行分类,从而推测人的情绪;卷积神经网络通过将特征提取与特征分类相结合,在图像识别领域中表现出了良好的性能,可以对人脸表情进行有效识别。本文采用软硬件协同的方式,利用Xilinx公司的ZYNQ芯片对卷积神经网络进行硬件加速,实现人脸表情的高效识别。根据FPGA和ARM的特点划分软硬件模块,在FPGA部分设计卷积神经网络硬件加速IP,包括卷积运算模块、池化运算模块
论文部分内容阅读
表情识别指利用计算机提取人脸表情特征进行分类,从而推测人的情绪;卷积神经网络通过将特征提取与特征分类相结合,在图像识别领域中表现出了良好的性能,可以对人脸表情进行有效识别。本文采用软硬件协同的方式,利用Xilinx公司的ZYNQ芯片对卷积神经网络进行硬件加速,实现人脸表情的高效识别。根据FPGA和ARM的特点划分软硬件模块,在FPGA部分设计卷积神经网络硬件加速IP,包括卷积运算模块、池化运算模块和数据处理模块;在ARM部分搭建Linux嵌入式平台并设计表情识别软硬件协同程序,从而充分发挥FPGA和ARM各自的优势。卷积神经网络硬件IP的卷积运算模块采用Winograd快速卷积算法,通过对数据进行变换处理以降低计算复杂度,减少乘法器的资源占用;池化运算模块可根据网络结构选择均值池化或者最大池化,通过并行展开的计算方式加速运算。本文采用乒乓流水对硬件IP进行优化,设计双缓存结构并改进模块的执行时序,减少了硬件IP的总体运行时间。根据卷积运算的并行特点,设计了循环分块运算,并通过资源分析设置最佳的片上循环分块参数。利用数据处理模块设置的中间缓存,设计了多通道数据传输,提高了卷积神经网络运算速度。ARM部分通过生成BOOT.bin、编译Linux内核和修改设备树等方式搭建基于Linux的嵌入式开发平台;软硬件协同程序包括三个部分,首先对输入图片进行人脸检测、特征图尺寸调整、数据类型转换等预处理,然后设计硬件IP驱动程序,使卷积神经网络硬件IP可根据训练好的网络模型进行相应运算,最后利用分类函数计算表情识别概率,将结果通过设计的Qt图形界面进行显示。本文首先在PC平台基于TensorFlow框架搭建表情识别卷积神经网络,提取并处理训练完成的网络参数;其次,在Zedboard开发板上,利用得到的网络模型,以软硬件协同设计的方式实现表情识别系统;最后,对表情识别结果的准确性和软硬件协同设计的耗时等进行测试。实验结果表明,本文的表情识别系统在保证准确率的同时,具有速度快、功耗低的优点。
其他文献
大规模图像数据集已经成为一种获取信息的可靠来源,在各个领域发挥着越来越重要的作用。快速有效的检索这些大规模图像数据集成为现阶段的一个研究热点。因此,如何高效地检索大规模数据集对用户与网络公司来说都是一项挑战。传统数据库无法获取图像中有价值的信息,不能满足图像处理和检索的需要。因此,在图像检索领域,建立一个能够产生准确输出的信息检索系统是至关重要的。本文针对于大规模图像数据集的内容检索,提出了一个高
图像融合目前广泛应用于计算机视觉等图像处理领域。图像融合是将来自多个输入图像的所有重要细节合并到一幅图像之中,得到的合并图像与单个源图像相比可以对场景进行更好地描述。融合后的图像包含更多的相关信息,这使其更适合计算机或人类视觉的研究。图像融合在数字成像、医学诊断、军事、遥感、机器人和监控等领域有着广泛的应用。本文还进行了图像融合和保持图像初始结构的机理的研究。这项任务的目的是在不造成失真或信息丢失
无透镜成像是成像技术中不断发展的轻量级检测和经济高效的技术,无需样品和图像之间的几何同构。该技术用于多个应用,如即时护理设备,微流体和生物学功能,可通过非常便携的平台生成高分辨率图像。由于人们越来越强烈地渴望对精细细节进行可视化,特别是在生物标本(如亚细胞样本)中,全息图像重建一直是人们越来越感兴趣的领域。这是因为在图像重建成功后,可以看到无透镜图像的精细细节。但是,在图像恢复过程中,总是会相位丢
行人意图预测是行为分析领域中的一项重要任务;将轨迹数据、图像等信息作为输入,模型能够准确预测行人未来意图(如在交通路口中是否过马路);该任务在人机协同HRC、自动驾驶AVs等视觉领域具有广泛的应用;第一视角下预测行人意图极具挑战性,受到多个因素的影响;(1)摄像机自身运动;在第一视角环境中,行人轨迹数据和图像信息受到摄像机自身运动的影响,与真实数据存在偏差;(2)行人运动的多模态特性;人们可以根据
近年来,海上运输业、旅游业日益蓬勃发展,在日益复杂的通航环境下,海上遇险事故频频发生。为了最大限度地减少事故损失,及时有效地海上搜救工作至关重要。在复杂的海洋环境中,利用红外探测技术的成像设备,构建海面遇险目标搜寻系统,它能够快速并大范围地搜寻海面遇险目标,从而提升海面遇险目标的检测、定位和跟踪能力,最终提升复杂海况下关于海面遇险目标的搜救成功率。然而红外图像通常具有一些非理想的特征,如对比度低、
随着计算机视觉领域的进步与数字图像技术的发展,人们获取信息的手段越来越多样化,不再只依赖自己的感官系统。视频作为人们获得信息的重要途径愈发受到人们的喜爱,但是由于各种环境因素产生的抖动影响了人们获得视频的质量,并使人们难以从抖动的视频中获取信息并且会造成眼睛的不舒适,长期观看低质量含抖动的视频会对人类的视觉产生严重的损害并影响人们获取视频中关键的信息。近年来摄像机被广泛的应用在军事、医学、交通管制
建设新型电力系统框架下高比例新能源场站的投运,将加重电能质量污染,导致损耗增加、设备损坏以及换流站直流单元闭锁等故障。通过建电能质量仿真评估技术体系,灵活应用于新能源场站入网评估,可实现电能质量问题专项分析预评估、电能质量暂态事件影响范围评估、电能质量治理技术验证评估和电能质量治理设备性能验证测试。
骨质疏松症是一种全身性骨病,该疾病会引发骨矿物密度、骨质量下降、骨微结构破坏以及骨脆性增加从而导致骨折,引起严重的并发症,甚至可引发残疾或死亡。识别骨质疏松症的风险因素对于该疾病的发病机制研究和预防至关重要。目前为止,一些体格指标与骨质疏松症之间的因果关系仍需进一步研究。本研究使用孟德尔随机化(Mendelian Randomization,MR)方法对身高、身体质量指数(Body Mass In
无透镜数字全息显微成像因其小型化、成像视野大、便携化等优点,在生物监测方面有很大的应用前景。本文将无透镜全息显微技术与彩色相机的Bayer滤光片阵列相结合,研究了一种无透镜全息显微成像方法,该成像方法研究利用彩色相机采集一张复合全息图,由于相机表面的Bayer滤光片阵列,便可同时获取对应红绿蓝三种波长的全息图信息,从而减少了所需的数据量,提高效率。研究了基于Bayer滤光片阵列的无透镜全息显微成像
火灾对人们日常生产及生活造成了严重的危害。烟为火始,快速、准确检测出火灾早期烟雾并预警,是减少火灾危害的重要手段。针对目前火灾烟雾检测算法存在小目标识别准确率较低、复杂场景适应性差等问题。本文采用基于Faster RCNN的目标检测模型,对早期火灾烟雾检测方法进行研究。本文的主要研究内容如下:给出一种基于可变形卷积的特征提取网络模型。针对卷积神经网络中标准卷积固定的几何结构无法自适应烟雾目标形变的