基于视觉的实时手势识别方法研究

来源 :大连理工大学 | 被引量 : 4次 | 上传用户:xjtu_kendy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来随着计算机设备在人们生产生活中的普及,人机交互成为最重要的计算机应用研究领域之一。有别于传统的键盘鼠标等输入方式,手势识别作为一种更自然的人机交互形式,已经成为人机交互领域的研究热点。传统的手势识别技术主要依赖于数据手套或特定设备,具有穿戴不便、价格昂贵和准确率低等缺点。随着计算机视觉研究领域的发展和计算机摄像头设备的普及,研究基于计算机视觉的具有成本低廉、实时易用和准确率高等特点的手势识别方法十分必要,这不仅能提高手势识别系统的用户体验,而且也将促进手势识别技术在日常生活中的应用。手势识别一般分为静态和动态手势识别,本文利用机器学习和深度学习相关理论,对基于Leap Motion和普通网络摄像头的静动态手势识别方法分别进行了研究。在静态手势识别研究中,针对Leap Motion的手势模型数值数据,本文设计了一种基于手指指尖互距离的特征T,实验结果表明该特征能显著的提高手势分类准确率。为进一步提高分类准确率,本文提出一种多特征融合方法对手势模型数值特征和手势图像的HOG特征进行融合,采用多分类支持向量机方法在手势数据集进行十折交叉验证实验。实验结果表明,测试集上的分类准确率达到了99.42%。基于以上工作,本文提出一种有效的基于Leap Motion的实时静态手势识别框架。对于动态手势识别,本文提出基于三维卷积的动态手势识别网络3D-GesNet,并提出一系列方法对其进行改进,实验结果表明该方法超过了大多数主流的动态手势识别方法。同二维卷积仅能学习图像的空间特征不同,三维卷积能够同时学习空间和时序特征,保持了空间时序特征的统一性和整体性。本文提出的3D-GesNet仅以手势的RGB信息作为输入,在大规模手势数据集Jester上能够取得94.59%的分类准确率,同时识别速度能够达到182FPS,具备实时识别的能力。此外,本文针对动态手势提出了一种有效的空间时序数据增强方法,实验结果表明该方法能将分类准确率提高约2.5%。本文基于迁移学习和t-SNE可视化等方法对3D-GesNet提取的3GN特征进行了一系列对比实验,实验结果验证了3GN特征是泛化的、可区分的和压缩的。本文的主要贡献有:(1)针对静态手势识别任务,针对数值数据设计了基于手指指尖互距离的特征T,并提出了多特征融合方法对Leap Motion的图像特征和数值特征进行融合。(2)针对动态手势识别任务,本文提出了基于三维卷积动态手势识别网络3D-GesNet,并对此提出一种改进结构3D-GesNet-B。(3)本文提出一种有效的针对动态手势的时空数据增强方法,能够有效地减少模型过拟合,提高分类准确率。
其他文献
冠状动脉微栓塞(Coronary Microembolization,CME)是急性冠状动脉综合征(Acute Coronary Syndromes,ACS)患者行经皮冠状动脉介入治疗(Percutaneous Coronary Intervention,PC
土传病害作为植物病害中的一类,主要危害植物的根部和茎部,严重制约了农业生产。随着作物类型单一化种植以及复种指数的提高,该类病害的发生越来越严重。众所周知,土传病害难于防治,尤其是一些复种指数高或多年生的经济作物,例如大豆、棉花、烟草、人参、西洋参及蔬菜等,目前仍以化学防治为主,但防治效果不稳定,而且产生药物残留问题,国家在引导生物产业的发展,尤其是在农业领域,中国土地的确需要微生物产品。本研究开展
随着社交网络的快速发展,网络上的数字图像信息以海量的方式传播,并仍在以几何级数的方式不断增长。为了满足人们对于图像内容检索的需求,基于内容的图像检索研究正受到越来
<正>肺栓塞是以各种栓子阻塞肺动脉系统为其发病原因的一组疾病或临床综合征的总称,包括脂肪栓塞综合征、羊水栓塞、空气栓塞等[1]。抗凝治疗为该病的治疗方案之一,华法林适
以二苯基碘鎓六氟磷酸盐(PF)为催化剂实现了对双酚A型苯并噁嗪(BA)的催化固化。通过差示扫描量热仪(DSC)和动态机械热分析仪(DMA)研究了PF对BA固化行为以及热力学性能的影响,
采用水浴回流法提取灵芝孢子粉粗多糖,再依次使用DEAE Sepharose Fast Flow离子交换柱和Sepharose CL-6B凝胶色谱柱分离纯化得到2种多糖组分GLP1a和GLP1b,HPSEC法测得2种组分
为了拓展光纤型光催化反应器在实际废水处理中的应用,本论文以构造新型光纤型光催化反应器为目标,开发了在低温条件下制备锐钛矿型纳米TiO2溶胶以及在聚合物基底上直接沉积Ti
灵芝Ganoderma lucidum为多孔菌科灵芝属药食两用真菌,是我国具较高药用价值的传统珍贵药材。灵芝孢子粉多糖是灵芝中的主要活性成分,现已证实其具有多种生物活性,在医药领域
<正>济南,这块山水优美的宝地,遍布着700多处天然涌泉,其泉水之多,流量之大,景色之美,独步天下。既有久负盛名的趵突泉、黑虎泉、珍珠泉、五龙潭,又有散落在市井深处或郊区山
巨磁阻抗(Giant Magnetoimpedance,GMI)效应自从1992年被日本名古屋大学毛利家雄教授发现以来,其巨大的应用前景很快吸引了全球各国学者的关注。基于GMI效应的磁传感器因其高