基于K-means和SCHMM的中国手语识别算法的研究

来源 :北京工业大学 | 被引量 : 0次 | 上传用户:yinzheng1974
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
手语识别作为多模式人机接口领域的一项重要组成部分,已经吸引了越来越多的专家和学者们的注意。手语识别的研究目标是让机器“看懂”聋哑人的语言。这里“看懂”有两种含意,一种是将聋哑人的语言逐词逐句地转换为相应的书面语言,另一种是对聋哑人语言中所包含的要求或询问做出正确的响应。 本文的研究工作是针对基于统计学的手语识别展开的,文中主要包括对中国手语单字词、双字词、多字词识别方面的内容。目前对于手语识别,存在的基本问题有:解决手语数据样本匮乏情况下训练模型的问题,解决非特定人问题,以及如何提高识别系统的识别速度等问题。 统计学的手语识别通常需要大量的样本来训练模型,通过分析手语信号的特点——时序列变化,以及手语样本匮乏,提出使用半连续的隐马尔科夫模型(SCHMM)作为识别系统的识别方法。SCHMM不仅能很好的描述手语时序列变化的信号,而且由于所有状态共用几个概密函数,使得模型中的参数减少,可以用较少的样本来训练模型。实验结果很好地证明了这一点。 在如何提高识别系统的识别速度方面,观察到近来所开发基于统计学方法的手语识别系统中,识别过程大多采用单级的全局查找,即待识别词与词库中每一个词的模型(通过统计建模)进行计算,找到概率最大即为结果。当词库中词汇数量增加时,识别的速度将受到严重影响。目前如何提高手语识别系统的识别速度已成为国内外关注的热点问题。考虑到待识别词与词库中每一个词的模型进行计算是一种计算上的浪费,是否可以采用一种分层的思想来缩小搜索范围?基于此方面的考虑作者在本文中提出了一种具有多级分类的手语识别方法,并利用该方法设计实现了一种具有多级分类的手语识别器。实验表明多级SCHMM识别器与单级的SCHMM识别器相比,在保持识别率基本相同的情况下,识别速度得到了较大的提高。
其他文献
随着计算机技术的快速发展,地理信息系统(简称GIS)以其地理信息的电子化、可视化、中央存储管理等优点在信息领域得到很大的发展。近年来在国防、交通运输、农业、林业、水利
随着电子商务的飞速发展和广泛应用,网络安全及其形式化分析引起社会的密切关注,逐步成为计算机科学研究的热点领域。非否认技术作为网络安全中最具价值的研究问题之一,在避免电
多标记学习最早出现在文档分类问题中,由于歧义性问题的存在,造成一条数据可能同时具有多个不同的类别标记。多标记学习问题广泛存在于现实实际问题中,多标记学习已逐渐成为国际
工程信息管理系统是网络技术与工程管理有机融合的整体,它以网络为平台,以工程管理为主题,在实现过程中其工作效果与系统的实际性能休戚相关,如何将处于不同地域不同网络不同环境
本文比较了国外成熟的企业间集成的解决方案,学习优秀的设计理念,结合Web Service,XML等技术,同时秉承原有CP_EDI系统的先进设计理念,开发了基于Web Service技术的企业间集成方案
面向服务的体系结构的出现和发展使得Web服务成为当今服务及软件开发的发展趋势。由于功能有限的单一的Web服务在多数情况下不能满足用户的需求,出现了将多种web服务按某种特
随着电子商务、电子政务的迅速发展,人们从现实世界进入电子世界,网络成为人们从事各种业务活动的重要渠道,因此构建一个安全、可信的网络环境受到越来越多的重视。世界各国经过
随着Intemet技术和网络业务的飞速发展,用户对网络资源的需求空前增长,网络也变得越来越复杂。不断增加的网络用户和应用,导致网络负载沉重,网络设备超负荷运转,从而引起网络性能
本文在分析了当前分布式PKI环境下证书验证存在的问题后,提出了一种证书验证代理服务器的方案,由该服务器来执行复杂的证书路径构建和证书路径验证的工作,从而将客户端从复杂
在网络得到快速发展和应用的现代社会,信息安全问题成为人们密切关注的问题之一。数字签名作为一种保障信息安全的技术,在确保信息的完整性、不可伪造性、不可否认性方面发挥了