基于深度学习的手势识别、人手检测及模型压缩的研究

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:iamssisy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,人机交互技术一直在不断发展,其中基于手势的人机交互方式是最自然、最直观的方式之一。手势识别和人手检测等技术是这种交互方式的关键,它们一直以来都是计算机视觉领域中的研究热点。尽管这些技术已经得到了广泛的研究,但是它们在实际应用场景中所必然会面临的复杂背景和遮挡等问题仍未得到有效的解决。深度学习是目前手势识别、人手检测等任务的主流解决方法,其在泛化能力、鲁棒性等方面比传统算法有巨大的优势。然而,深度学习模型通常会占用较多的计算资源和内存,不利于其实际应用。针对上述问题,本文主要对基于深度学习的手势识别、人手检测及其模型压缩和加速技术进行了研究。针对静态手势识别中复杂背景的问题,我们提出了一种二阶段的识别方法,其中包含了人手姿态估计算法和人手姿态分类算法。我们使用了卷积姿态机来对人手关键点进行定位,多阶段序列结构和中间监督的引入使其能够在遮挡和复杂背景等情况下也能做出准确的预测。此外,我们还对模糊高斯混合模型做了改进,并将其用于人手姿态分类,根据输入的人手位置特征将其划分到对应的手势类别中。改进后得到的分类器不仅能够准确地对目标手势进行准确的分类,还能够有效地拒绝非目标手势样本。另外,由于手势识别系统的两阶段设计,算法能够很方便地对手势类别进行扩展。在进行手势识别前,通常需要先使用人手检测算法从图片中准确检测出人手区域。为了兼顾检测算法的速度与精度,我们使用了单阶段目标检测网络YOLOv3模型用于人手检测。我们通过使用更优的预训练权重和适当的数据增强方法,有效提高了模型的检测效果,为模型的压缩和加速算法提供了一个较高的基准。为了进一步降低人手检测模型的计算资源消耗和内存占用,我们基于Network Slimming通道剪枝算法对YOLOv3网络进行模型压缩和加速。在训练阶段对BN层的γ参数施加稀疏正则约束,逐渐减少冗余通道的权重,从而实现通道剪枝。针对YOLOv3模型中的残差连接,我们提出了残差剪枝的方法,提高了通道剪枝的灵活性。另外,我们使用了自适应剪枝阈值的方法来确定剪枝通道并且对其对应BN层的β参数进行了处理,大大降低模型剪枝带来的损失。通过将卷积层和BN层进行融合,模型的推断速度进一步提高。最终,模型的体积和推断用时大幅度减少,并且能够保持检测精度几乎不变。
其他文献
随着岸电技术的发展,我国一些重要港口已经实施了船舶接用岸电项目的研究和建设,针对不同船型的用电机制安装各类岸电设备,具备了供应岸电的能力,解决了岸电项目存在的现实问题。供电企业和港口企业践行低碳经济的高度责任感与使命感,积极推广岸电项目,进一步开拓电力市场,开始了提供岸电上船服务的实践和探索,取得了一些宝贵的经验。但目前岸电推广还举步维艰,未能普及使用,港口、船方和供电企业等各方都存在一些困惑,岸
学位
学位
自20世纪中期互联网技术的不断发展,信息技术跟随着迅猛发展,用户随时随地都产生了大量的图像、文本、音频、视频等信息。如何从这些不断增长的数据中得出对人们有利用价值的
预瞄主动悬架系统能够测量车辆前方的路面不平度,然后将其用于控制主动悬架,从而进一步提升车辆的行驶平顺性。在现有的预瞄控制算法研究中,通常将预瞄控制问题作为输入时滞问题,并将预瞄路面的不平度直接作为悬架系统将要受到的垂向激励。这导致控制系统难以适应不同的车速,且未考虑轮胎对路面不平度的滤波作用。为了使预瞄主动悬架控制系统能够适应不同的车速,并使其能够获得更准确的路面不平度激励,本文考虑轮胎包容特性对
在信息技术(包括计算机和数字技术)的推动下,物流企业的国际化竞争日趋激烈,物流企业需要利用科学的方法来制定营销策略,不断优化与调整营销方案才能适应不断变化的市场环境。SF公司是一家1993年成立,以国际物流服务业务为主要业务的物流企业,在近30年的发展中,其国际物流业务收入占比不断提高,品牌影响力不断提升。但受中美贸易等摩擦的影响,公司的主流业务的营销环境发生了较大改变,营销策略的调整与重新梳理已
学位
税务系统是我国行政事业单位当中的重要组成部分,对于国家及社会具有较大的效能贡献。对于所有组织而言,人力资源都是最为宝贵的资源之一,只有充分开发和利用各类人才的力量,才能让组织长治久安获得持续发展的动能。对于税务系统而言,人力资源也同样发挥着至关重要的作用,科学有效的人力资源管理工作,能够在现有的基础上大幅度提升工作的效率及效果,提供更令纳税人满足的服务,带动税务系统整体的发展及进步。然而,目前我国
学位
目标检测是计算机视觉领域一个非常富有挑战性的课题,也是许多计算机视觉应用的基础。它主要关注如何使电子设备能够快速,准确地从自然场景中捕捉并识别出人们关注的物体。它
学位
无线视频传感器网络提供了一种成本低、便捷性高、安全性强的安防领域目标入侵跟踪问题的高效解决方案。针对农村小水电站危险系数高,人工监管不到位等问题,无线视频传感器网