人脸识别的深度神经网络硬件加速器研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:piaodedaocao
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
身份识别在信息化终端应用领域发挥着重要的作用。其中人脸识别技术是一种安全且高效的非接触式身份识别方法,被广泛应用于金融、安防等领域。但是由于人脸特征的复杂性和多样性,导致传统的人脸识别算法难以在复杂多变的环境中取得稳定准确的识别效果。基于深度学习的人脸识别算法能够有效的进行人脸特征提取,并且可以通过数据集的扩展和图像的预处理适应不同环境下的人脸图像。基于卷积神经网络的深度学习方法只能提供局部感受野而缺乏对人脸全局特征的表达,限制了其识别精度,具有全局感受野的vision transformer(ViT)方法可有效解决这一问题,但是其参数量过大且需要大量数据进行训练,难以部署在资源受限的边缘侧设备上。鉴于此,本文重点研究人脸识别ViT神经网络模型及其低功耗硬件加速器。本文在对比研究卷积神经网络(CNN)和ViT网络的基础上,建立了全局特征提取和局部特征提取相结合的改进ViT人脸识别模型。通过局部特征提取单元,实现了人脸特征的降维与参数量的缩减;通过全局特征提取单元,实现了对图像中每个像素点的关联性提取,避免了图像分块时造成的关键特征分割。搭建深度可分离卷积和ViT人脸识别网络进行对比实验,得到改进ViT网络能够在LFW数据集上取得98.71%的准确率,YTF数据集取得96.33%的准确率,改进后ViT网络的训练难度降低。利用消融实验,证实了局部特征提取单元和全局特征提取单元的有效性。本文根据改进的ViT网络结构设计其硬件加速器。整体硬件架构基于网络结构可配置和计算单元可重用的策略设计。对其中的关键算子单元提出计算并行的实现方案,并完成了AXI高速接口和内部存储结构的设计。而后,使用Modelsim搭建了时序仿真平台,完成了对各个功能模块仿真验证。在此基础上,将加速器部署到FPGA平台进行系统原型验证,结果表明量化后的int8网络可达到97.37%的人脸识别准确率,当加速器工作频率为100MHz时,功耗为4.293W,运算操作数为97.2GOPS,能效比是NVIDIA GTX1080TI GPU平台的4.24倍。最后,基于smic的0.13μm工艺库,使用Design Compiler对硬件加速器进行了综合,通过采用门控时钟对加速器进行低功耗设计优化,使得功耗降低为之前的54.5%。本文对基于ViT模型的人脸识别算法以及ViT低功耗硬件加速器设计、原型验证和综合方面的工作,为ViT模型在边缘侧硬件部署打下了基础。
其他文献
同时定位与建图(SLAM)指的是机器人在陌生的环境中利用传感器获取的信息进行位姿估计,进而确定移动机器人自身具体位置,并建立与周围环境一致的地图。为了适应移动机器人不同的运动状态和多变的环境,SLAM技术在不断地发展。其中视觉SLAM以相机作为传感器,结构简单且价格低廉,用拍摄的相机帧作为输入,能够收集大量的信息。在快速运动和光照变化的情况下采用视觉和惯性融合的方式提高定位精度。本文主要的研究内容
学位
管路作为飞机液压系统传输能量、执行器作动的“生命通道”,其振动问题是飞行安全的隐患。飞机液压管路在工作环境中承受着泵源输出的高压脉动激励和发动机通过机体传递的随机振动激励,这两大激励源可能会引起管路及其上零部件产生剧烈的流固耦合振动和结构振动,如果管路系统的固有频率接近泵的脉动频率以及发动机基频时,极有可能诱发机械共振。此外,由双泵协同工作输出高压脉动油液经三通接头汇流输出,以满足飞机起飞和降落期
学位
随着互联网与流媒体技术的发展,越来越高质量的视频逐渐成为当今网络数据流量的主流,且其数据体量有愈发庞大的趋势。但实际应用中,由于视频采集设备的限制,导致许多视频的分辨率不足;再经极端带宽条件传输后,视频质量会大大降低。这类视频的质量增强不仅要考虑下采样损伤的修复还要考虑编码损伤的修复,即需要从低质量的低分辨率视频中恢复高质量的高分辨率视频。截至目前,压缩视频质量增强方法和超分辨率方法已经取得了重大
学位
液压系统作为飞机的核心动力来源,其遍布飞机全身的液压管路,犹如人体中的血管组织,是飞机液压系统的重要构成部分之一。飞机液压管路是传送油液工作介质的主要通道,也是构建液压控制回路的重要纽带。现代航空液压系统正朝着高压化、大负载和轻质化等方向发展,液压管路的强度储备越来越少,其疲劳问题愈发突出,如何规避或延缓由疲劳引发的液压管路结构破坏成为了当前军用和民用航空业所面临的共同难题。为此,国内外诸多学者都
学位
量子计算因其基于量子态叠加原理与量子纠缠特性,使得计算能力获得指数级的加速。采用量子算法使得解决某些在经典上困难的问题成为可能。然而,当前量子算法对量子比特需求量的增长远远高于量子计算机的发展速度,这也成为了亟待解决的关键问题之一。而分布式量子计算可将多个量子比特数较少的量子计算机组合起来完成较大规模的量子计算任务,其也成为了解决当前量子计算机比特数量不足问题的一种方案。可是,通过量子网络互联起来
学位
研究目的:目前,青光眼治疗方法主要是降低眼压,临床上许多患者尽管眼压控制良好,但视野仍存在进行性缺损。随着新药的不断问世,PH公司发现了一种新型Rho激酶抑制剂药物PHP-201,PHP-201不仅能够降低眼压,还能保护视神经。本文对PHP-201进行前景分析,为了研究PHP-201是否可以引进中国市场。研究方法:对PHP-201与市场常用治疗青光眼药物的作用机制、不良反应、用法用量和临床疗效进行
学位
目的苯甲酸阿格列汀是口服有效的特异性二肽基肽酶-Ⅳ(Dipeptidyl Peptid-ase Ⅳ,DPP-Ⅳ)抑制剂,用于治疗Ⅱ型糖尿病,由于其市场前景好,对其合成工艺进行研究具有重要的意义。本论文对苯甲酸阿格列汀的合成工艺进行优化,探索适合工业生产的合成路线及合成条件。方法通过3-甲基-6-氯尿嘧啶与2-氰基溴苄的亲核取代反应得到2-(6-氯-3-甲基-2,4-二氧代-3,4-二氢-2H-嘧啶
学位
目的:研发化学仿制药利培酮片,通过体外溶出曲线及行为与体内生物等效性的相关性研究,确定利培酮片的处方组成、制备工艺及关键质量属性要求,使自制品与原研品达到质量、疗效一致性。方法:1.通过对项目的前期调研,初步确定了利培酮片的制备处方及工艺;结合原研品(商品名:Risperdal?)制剂处方,采用湿法制粒压片工艺得到自制品;2.对已购利培酮原料药进行研究,考察其晶型、粒度分布、溶解度、引湿性等指标,
学位
随着互联网技术的不断发展,视频已经成为人们日常生活中重要的信息来源与娱乐方式,而随着硬件设备的不断进步和人们对于画面内容更加贴近真实环境的需求不断增加,高动态范围视频应运而生。高动态范围(High-Dynamic Range,后简称HDR)视频通过更强亮度表达能力,搭配上更大的色域空间,使视频画面更加贴近现实场景,从而实现更好的视频观看体验。而另一方面对于当前依旧拥有很大占比的标准动态范围(Sta
学位
随着机器学习和深度学习的高速发展,高性能的目标跟踪技术得到了广大研究者的关注,并广泛应用于各个行业与领域。近年来,KCF(Kernal Correlation Filter)跟踪算法凭借其较好的跟踪精度与极高的跟踪实时性在实际的工程应用中占据一席之地,此算法计算复杂度低,适合在硬件资源有限的嵌入式平台上部署,但KCF算法在目标形变、尺度变化以及目标遮挡的场景下表现不佳,很容易发生跟踪失败的情况,因
学位