细胞神经网络在手语视频分割中的应用研究

来源 :兰州理工大学 | 被引量 : 1次 | 上传用户:hotter_day
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
手语是由手形、手臂运动并辅之以表情、唇动以及其他体势表达思想的视觉语言,是聋哑人进行信息交流的最自然方式。在移动网络带宽有限且手语视频数据量大的情况下,要使聋哑人和正常人一样利用手机进行实时双向视频通话,就必须保证在手语视频可理解性的同时最大化压缩手语视频,为此,研究人员提出了感兴趣区手语视频编码方法。感兴趣区手语视频编码方法的前提条件是快速分割出手语视频中的面部、双手和背景区域。在进行手语视频分割时,面临的主要问题是如何解决因处理大数据量运算所造成的实时性问题。细胞神经网络(Cellular Neural Network, CNN)由于具有高速计算能力,以及与人类视觉系统(Human Visual Systme, HVS)很多的相似性,使得它特别适合图像/视频处理。因此,有必要研究CNN在手语视频分割中的应用及其相关算法。本论文研究了细胞神经网络(Cellular Neural Network, CNN)在快速手语视频分割中的应用,本论文具体工作如下:(1)研究了基于CNN的肤色检测在手语视频分割中的应用。为了减少不同照明条件对肤色检测的影响,在肤色检测之前,采用gray world方法对RGB颜色空间进行了颜色均衡。接着,对YCbCr颜色空间数据处理方法进行了优化。再利用肤色信息在YCbCr颜色空间采用阈值法,进行基于CNN的手语视频分割。相比于同类算法,该方法简单快速,能够适应实时的手语视频分割。(2)研究了基于CNN的运动检测在手语视频分割中的应用。该方法采用差分法对手语视频进行分割,该算法复杂度低,且直接面向灰度图象,能够获得较多的运动信息,从而使运动对象分割具有更好的精确性和语义性。(3)研究了一种基于CNN的将肤色和运动信息结合起来的手语视频分割算法。该方法首先利用肤色信息特征进行基于CNN的肤色检测,检测出手语视频中的肤色区域;然后对肤色检测结果,利用帧差法进行基于CNN的运动检测,获得初始的手势区域。由于提取出的视频对象轮廓容易出现“空洞”和“重影”现象,很难保证其完整性,所以,再对其进行中值滤波。最后采用形态学处理方法,进行空洞填充和边界平滑,最终得到手语视频中人的面部和手部区域。实验表明,该算法能够快速准确地检测出人的面部和手部。
其他文献
光突发交换技术将光路交换和光分组交换结合,兼顾了二者的优点,有望成为下一代全光通信网络的关键技术。由于在OBS网络中突发竞争的存在,使得如何减少突发丢失的问题成为OBS网络
随着信息产业发展第三次浪潮的掀起,物联网在互联网的基础上得到不断延伸和发展。《物联网“十二五”发展规划》提出重点发展物联网感知制造业。RFID技术不仅是其感知层的关键
矢量量化技术是70年代后期发展起来的一种数据压缩技术,因其具有压缩比大、解码简单以及失真较小等优点,现已被广泛应用于图像压缩和语音编码中。   本文围绕矢量量化技术在
互联网时代的来临对IP地址提出了更迫切的需求。从目前IPv6移动终端的发展现状来看,加快发展和全面部署IPv6技术是必要的。根据《中国移动TD/TD-LTE终端IPv6技术要求》的要求,
正交频分复用技术(OFDM)作为移动通信技术领域内的核心技术之一,以其独有的传输速率快、抗多径衰落能力强以及频带利用率高等特点被众多专家学者认为是未来通信发展方向的研
随着传感网与互联网的结合,数字化和智能化的家用设备的迅猛发展,以及网络技术的日益成熟,数字家庭网络这个理念日益深入人心,并且得到了越来越多的关注。同时,能够实现数字家庭网
纹理识别是计算机视觉领域一个重要的课题,本文在传统的纹理分析方法基础上,重点研究统计几何特征、灰度梯度共生矩阵以及对数极坐标变换,并与向量机结合构建分类系统。针对
随着计算机技术的普及和网络技术的飞速发展,世界进入了前所未有的信息化时代,为企业的发展提供了种种机遇和更广阔的发展空间,将企业卷入信息化的大潮中来,企业信息化是企业
视频监控系统在创建平安城市/社区、预防和控制犯罪等方面发挥了强大的作用。同时,它也带来了个人隐私信息可能被泄露的问题。因此,监控视频的隐私信息保护受到了公众越来越多
随着TD-LTE试验网在全国15个主要城市的建设,TD-LTE网络的商用日期指日可待。此后一段时期内,TD-SCDMA网络将向TD-LTE网络平滑过渡,两种网络将长期并存为用户提供服务。由于国内