手势识别在沉浸式全景立体视频直播系统中的研究与应用

来源 :郑州大学 | 被引量 : 0次 | 上传用户:qq02040610
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
虚拟现实(Virtual Reality,VR)技术已经成功应用到了教育、旅游、游戏等诸多领域,在视频直播领域也有研究者希望结合VR技术,观看全景立体视频,带来全新的直播观看体验。但是,在实际应用中总会面临诸如全景视频实时拼接、高分辨率视频压缩编码等问题,所以实时的全景立体视频直播系统在构建过程中依然困难。本文设计并实现了全景立体视频直播系统,以八目全景环形镜头为基础,拼接360°双目视频,结合VR头盔,直播观看全景立体视频,给观看者带来全新的视觉体验。同时,针对VR中使用手柄交互不方便的问题,进一步研究了基于视觉的手势识别技术,结合Leap Motion手势体感采集相机,实现了在全景视频直播系统中,识别预定义的手势,完成直播系统中视频画面的交互。本文的工作主要包括:(1)结合卷积神经网络,提出了多模态融合时间分割网络模型(MultiModality Fusion Temporal Segment Networks,MMFTSN),进行手势识别。该模型将RGB、Depth、光流三种模态的视频数据等间隔分割,对分割后的子视频序列随机抽帧,再使用卷积神经网络对抽取的帧进行分类,最后采用权重融合的策略,融合三种模态的识别结果,从而完成动态手势识别任务。使用该网络模型,在手势数据库Chalearn LAP Iso GD上得到60.2%的识别率,优于相关算法表现,表明本文提出模型的有效性。(2)设计并实现了全景立体视频直播系统。使用多相机实时采集并拼接了双目全景视频,采用H.265编码算法,对视频进行更加高效的压缩编码,将视频流传输推送到云端转发,接收端使用VR头盔,结合Unity开发工具,实时接收并观看全景立体视频。(3)基于Leap Motion深度相机,在直播系统接收端,设计并完成虚拟手势交互实验。通过Leap Motion手势传感器,获取手势关键点的位置信息,进而定义手势关键点的距离和速度特征,通过这些特征识别预定义的手势,结合VR头盔和Unity,完成直播系统中视频画面的旋转、缩放、移动操作。本文将手势识别技术应用在全景立体视频直播系统中,实验结果表明,系统可以满足直播需求,且能够识别预定义的手势,完成直播系统中的手势交互,实现更加自然的人机交互方式,为未来VR技术中取代手柄交互提供了解决思路。
其他文献
近年来,与环境相关的各种问题成为了社会和学者关注的重点,国家也越来越提倡绿色,而全球变暖、异常天气、冰川融化速度加快等则反映出环境治理效果不明显,环境问题仍然严重。
近年来适合上小学生的人数越来越多,但是学校场地面积、人力等相关资源有限,公立学校无法给学生提供足够的午餐和午休场所。这给校外小学生托管机构带来蓬勃发展的机会,同时
近年来,随着中国经济与世界经济加速融合,越来超多的国内企业开始深度参与国际市场。但国内企业进入国际市场,首先面临的挑战是如何获得国际跨国企业的认可,以及中国产品在国
管理工程项目的主要目的就是采取一切方法让项目达到预期效果。在这个过程中着重强调的是结果,然而比结果更重要的就是完成目标的中间过程。对项目进行管理时,为了让过程结果
研究黄河水沙变化对黄河流域水资源管理与水环境修复具有重要的意义。近年来,受人类活动影响,黄河水沙产生显著变化,而影响含沙量的因素众多且作用复杂,构建精确的输沙预报模
随着中国经济社会的不断发展,汽车从原来人们印象中的奢侈品逐渐变成了必需品,普及面越来越广。伴随着我国居民对汽车需求量和整车保有量不断上升的同时,消费者开始越来越注
过渡金属催化的非活性烯烃的不对称双官能团化反应可以同时构建两个相邻碳–碳或碳–杂原子化学键以及构建相应的立体中心,该类反应已经成为制备复杂手性有机小分子的重要合
石墨烯作为一种二维碳材料,由于其良好的电化学稳定性、较大的比表面积和较高的导电性,在电化学传感方面显示出巨大的应用潜能。另一方面,超分子化学中分子识别的特点在于高
目前,微信公众平台已成为辽宁共青团开展青少年思想引领、网上舆论引导、团内信息发布的重要载体,也成为了团组织联系青年的重要手段。但是微信公众平台的用户多并不代表信息
随着互联网的高速发展,网购已经成为生活中一种不可或缺的消费方式。网购的便捷、多样性、便宜等特点使得大量的商家涌入网上销售平台,而能够吸引消费者则成为当下各商家的关