第一视角下的手势识别方法研究与交互系统设计

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:liliandidi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着增强现实(AugmentedReality,AR)和虚拟现实(VirtualReality,VR)等头戴式设备的不断涌出,头戴式设备的交互方式备受关注。目前市场上头戴式设备的交互方式主要为设备控制的接触式方式,然而基于视觉的非接触式交互方式能为用户提供更优越的交互体验。具体的,基于视觉的手势交互方式需要头戴式设备携带摄像头,以第一视角背向地采集交互者手势信息,光线变化、运动模糊、手势遮挡等因素使其在应用上具有非常大的挑战。因此,如何将视觉手势交互方式应用到头戴式设备中是一项非常值得研究的工作。本文针对第一视角下基于视觉手势交互中的难点,面向头戴式设备中的手势交互应用,以彩色摄像头为图像采集设备,展开了以下主要工作:(1)针对静态手势识别算法中模块组合带来的逐层误差累积问题,提出了一种基于Faster-RCNN网络的Hand-RCNN方法。方法同时实现了第一视角下静态手势的检测、识别与指尖定位三个功能,具体包括:a)图像预处理:均值规整化,增加边缘轮廓通道,引入批量归一化,加强模型特征表达。b)指尖定位:指尖定位从点回归问题转变为目标检测问题,结合点回归多次微调修正,使得指尖定位误差降低至3.77像素(pixels),获得较优的指尖定位效果。c)优化网络结构:针对特征提取网络、RPN网络、ROIPooling层与分类输出,进一步简化网络参数,降低特征映射维度,在保证网络精度的同时,使得网络参数数量降至37M,计算速度提高至35.71帧每秒(frame per second,fps),满足手势交互的实时性要求。(2)针对头戴式应用场景需求,搭建了一套第一视角下手势交互系统。具体的,以Hand-RCNN为基础,辅以运动跟踪、平滑滤波等方法,实现了手势漫游、确认、挥手、双手捏合等多种手势交互方式,并在此基础上,以索尼HMZ-T3头戴式设备为载体,设计了相关的手势集指令与交互界面,搭建了一套手势交互为主体的音视频娱乐系统。此外,本文还实现了系统在移动平台上的移植,且利用NEON优化技术进一步性能优化,旨在扩展手势交互在头戴式设备中的应用思路。
其他文献
目的:探讨伪膜性肠炎的内镜特征、临床表现及治疗。方法:对我院7年来诊治的16例伪膜性肠炎患者的临床资料进行回顾性分析。结果:全部患者在使用抗生素过程中或使用之后出现以
水蛭活血有效成分研究概况欧兴长(中国中医研究院基础理论研究所北京100700)水蛭用于治病,在国内外都有相当悠久的历史。在中国,水蛭始载于《神农本草经》,谓其能“逐恶血、瘀血”,破“血
追求经济效益最大化是企业永恒的主题,也是企业生产经营的根本目标。加强企业成本控制,不仅可以增加企业自身利润和市场竞争力,同时对提高国家税收也发挥了重要作用。但目前
21世纪以来,印度在日本官方发展援助中的地位日显突出。自2003年后,印度连续8年成为日本对外发展援助最多的国家。综合来看,日本不断加大对印度官方发展援助的动因及目标既有
目的探讨Viatorr覆膜支架在经颈静脉肝内门体静脉分流术(transjugular intrahepatic portosystemic shunt,TIPS)治疗肝硬化门静脉高压症的初期疗效。方法 2015年10月至2016年
目的:探讨前置胎盘孕产妇的最佳分娩方式。方法:收集我院2006年1月~2009年12月46例前置胎盘的孕产妇作为实验组,将同期随机抽取的46例正常孕产妇作为对照组。将两组的分娩方式
随着经济社会的发展,作为教育消费者的大学生要求更优质的校园服务,对高校后勤的期望显著提高,而高校后勤服务的调整速度和力度相对滞后,两者矛盾屡有发生。如何提升学生对后
泰州学派美学赋予了倍受轻视的"下"范畴以恰当的重要地位。"下"这一范畴包含着三个层面,分别是物质本体、平民主体和实践行动。这些在传统儒家思想中处于次要从属地位的存在,
中印同是发展中大国,双边合作基础广泛,但也存在着值得注意的矛盾与问题。双方需要在合作中不断消除疑虑、猜忌与误解,增加互信,在21世纪为和平与发展做出应有的贡献。中印双
导演张艺谋在20世纪末运用娴熟的影视语言创作出电影《我的父亲母亲》,影片中的影像元素在叙事和写意之间得到彰显。其中影像时空关系、主观视点、叙事表意符号等叙事元素营