基于深度学习的静态手势实时识别方法研究

来源 :太原理工大学 | 被引量 : 0次 | 上传用户：tsmcxuesheng

【摘要】

：

【作者】

：

辛文斌

【机构】

：

太原理工大学

【出处】

：

太原理工大学

【发表日期】

：

2021年01期

【关键词】

：

手势识别深度学习移动端设备 YOLOv3 CenterNet

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

手势作为一种简单且易表达的交流方式,无论是在人机交互领域,还是在其他应用领域,都有着十分重要的研究价值。相比于传统手工设计特征存在的繁琐复杂、识别率低等缺点,深度学习方法可以自动提取图像特征,且受图像背景因素影响较小,极大地提高了识别率。但随着目标检测技术的发展,其中大多数算法为了获得更高的识别率,一直在不断增加网络的深度,却忽略了这样做所带来的大量参数以及占用的大量计算资源,从而降低了模型的识别速度与模型在移动端设备上的可移植性。针对上述问题,本研究设计了一种基于深度学习的静态手势实时识别模型,在保证模型检测精度与速度均衡的同时,尽可能减小模型的训练时间及模型内存占比,使其有利于在移动端设备上的部署。针对移动端设备计算资源有限及存储空间小的特点,提出一种高效的Shuffle Netv2及YOLOv3集成网络静态手势实时识别方法,以减小模型对硬件计算能力的需求。为解决传统YOLOv3模型的主干网络Darknet-53参数量大、模型占用内存量大等问题,引入一种轻量化网络Shuffle Netv2代替原有的主干网络,以减小模型的计算复杂度,其次在模型中加入CBAM注意力机制来加强网络对通道和空间的关注度,最后采用K-means算法对自制数据集的先验框进行重新聚类,使其对目标进行精确定位来提高模型的检测精度。实验结果表明,经过所改进后的算法在保证检测精度与检测速度均衡的同时,模型的训练时间及权重占比内存取得了极大地改善。当采用PASCAL VOC数据集对上述改进模型进行测试后发现,如果图像中存在密集目标时,改进后的模型会出现漏检的问题。针对这种问题,采用了一种基于AnchorFree的目标检测算法Center Net,不需要额外的计算先验框尺寸,不但减小了部分计算量,而且在密集的目标图像检测中,取得了很好地效果。同样,基于移动端设备,Center Net也存在计算资源上的大量占用,在此引入一种专为移动端设备而设计的轻量化网络Mobile Netv3代替Center Net算法的主干网络,对原有算法进行优化。最后实验结果表明,所优化的模型取得了不错的效果,有利于在移动端设备上的部署。

其他文献

电梯运行状态非入侵式智能检测方法研究

我国是电梯生产和使用大国,随着电梯保有量持续增长,老旧电梯逐年增多,电梯困人故障和安全事故时有发生,严重影响了人民群众生命财产安全和经济社会发展稳定。而现阶段电梯的监管维保模式为定期模式,维保时间间隔相对固定,对于使用频繁的电梯,定期维保的频率低;而对于运行次数少的电梯,定期维保的频率又过高。为此,国务院办公厅下发了“国务院办公厅关于加强电梯质量安全工作的意见”,依法推进按需维保,推广“全包维保”

学位

电梯实时状态监测信息融合无迹卡尔曼滤波传感器自动矫正非侵入式

基于改进k-means分簇和灰狼优化的WSN路由算法研究

无线传感网络是大量传感器节点按照某种组网方式并通过无线通信而形成的网络,节点负责对监测对象的信息进行收集,然后将收集到的数据通过汇聚节点最终传输给用户。由于无线传感网络的成本较低,覆盖范围广和抗毁坏性强,所以被广泛应用于国防、医疗和家居等各个方面。网络中的节点有时会受到损坏或者在使用过程中电池能量用完,而且环境条件的限制人为去进行维护是不实际的,所以路由算法的设计在此时就起到了非常重要的作用,目前

学位

无线传感网络k-means优化灰狼优化路由分簇

基于高斯过程和混合模型的工控入侵检测技术研究

随着工业互联网、5G等新兴技术的发展,接入互联网的工业控制系统越来越多,工业数据传递的速度也越来越快,然而,互联网中存在的相关漏洞也在威胁着工控系统的安全。因此,保障其安全性避免被攻击是至关重要的。但是,由于工控数据具有维度高、冗余特征多的特点,导致现有的入侵检测技术依然存在着许多不足之处。而入侵检测性能优劣的关键在于是否采用了合适的分类算法以及是否根据数据集的特点进行了相应调整优化,因此,本文以

学位

入侵检测工控系统高斯过程灰狼优化高斯混合模型循环神经网络

基于深度强化学习的多智能体协同研究

近年来随着科技的进步,深度学习和强化学习的发展迎来空前盛况。深度强化学习技术逐渐成为诸多领域的热点技术。作为多智能体领域的重要研究内容,深度强化学习以其强大的特征提取能力提取智能体周边信息和环境信息,以其强大的感知探索能力感知适应复杂多变的动态环境,从而做出最优决策。其中被诸多学者广泛关注的问题是基于深度强化学习的多智能体协同,其旨在研究智能体如何在复杂多变的环境中通过有效协同控制达到整体性能最优

学位

混合动作值函数深度强化学习多智能体合作个体利益团队利益历史信息优先经验回放

基于改进BP神经网络模型的采空区特殊下垫面条件下径流预报研究

洪水的显著特点是年际变化不稳定且易受特殊地形的影响。一般流域缺乏引洪、滞洪、过洪能力,形成的大洪峰流量洪水不仅破坏周围居民的生活环境,带来经济损失,对居民的生命健康也是巨大的隐患。因而对流域的洪水发生过程进行预报是至关重要的。山西省由于存在大规模的采煤活动,改变了流域的下垫面条件,从而影响洪水形成过程。现阶段也有不少水文专家对该特殊下垫面条件下的洪水形成过程展开研究,但由于采空区特殊下垫面条件地势

学位

神经网络模型采空区参数优化径流预报

基于深度学习的X光安检图像危险品识别方法研究

X光安检技术被广泛应用于公共交通场所和物流快递等行业的安全检查工作中,在保障社会公共安全方面发挥了重要的作用。然而,目前的安检工作主要依赖于安检人员对X光安检图像的主动识别,容易受到各种不稳定因素的影响,导致误检和漏检的发生,具有较大的安全隐患。本文探索了两种目标检测方法在X光安检领域的应用,分别是精度较高但速度较慢的two-stage方法Faster R-CNN,以及速度较快但精度较低的one-

学位

深度学习目标检测Faster R-CNNRetinaNetsoft-NMSGIoU loss

数字图书馆服务平台功能需求分析

【目的/意义】顺应泛网络条件下数字阅读和文献检索与利用的新情况,实现国人共享数字资源,是数字图书馆创新发展和提高中华文化软实力的重要路径。【方法/过程】分别基于数字图书馆的服务理念、服务动机以及用户信息行为新特征,对数字图书馆服务平台的功能需求进行深入分析。【结果/结论】此分析为"构建国家云图书馆"服务平台建设提供参考,可以推动数字图书馆服务平台建设、信息服务等研究向纵深发展。

期刊

数字图书馆服务平台功能需求

基于异质图神经网络的推荐方法研究

当前信息爆炸时代,海量信息的生成也促使互联网与大数据分析等技术的快速发展。而我们在享受现代互联网带来的诸多便利的同时,也面临着信息过载（Information overload）的问题。人们难以便捷和迅速地从海量数据中有效汲取所需的各种信息。推荐系统研究面向这一现实迫切的任务需求,并迅速成为当前数据挖掘领域的研究热点。推荐系统方法可通过对数据信息进行建模,分析用户和项目间的潜在关联,从而挖掘用户行

学位

推荐系统异质图嵌入图神经网络异质信息网络兴趣点推荐

融合异构数据的序列推荐算法研究

云计算、大数据的发展促使互联网数据呈爆炸式增长,在这一背景下,人们越来越依赖推荐系统来过滤信息。无论是信息的生产者还是信息的消费者,推荐系统的出现都给他们带来了不小的益处。对于信息生产者来说,推荐系统使他们可以将所持有的海量信息有针对性地展示给不同的用户,在提高信息利用率的同时提升了服务质量,有助于提升用户满意度。对于信息消费者来说,推荐系统快速有效地提供给他们所需要的信息,减少了时间浪费,提高了

学位

异构数据会话推荐图神经网络邻居会话个性化推荐

基于循环矩阵投影的Nystr（？）m扩展研究

谱聚类作为一种灵活的热门聚类算法,在处理小规模数据集时通常优于传统的聚类算法,例如k-means。当数据样本量记作n时,它的计算复杂度为O（n~3）,空间复杂度为O（n~2）,巨大的损耗导致了谱聚类方法对于大规模数据集处理的局限性。受到核方法、Nystr（?）m扩展思想和循环矩阵等矩阵分解技术的启发,本文提出以下工作来解决上述问题:首先,为了提升聚类算法处理大型数据集的速度,提出基于随机傅里叶特征

学位

谱聚类核Nystr（?）m近似循环矩阵随机傅里叶变换特征分解乘法更新迭代

基于深度学习的静态手势实时识别方法研究

其他学术论文