手语识别中训练集数据生成及数据差异性分析的研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:maming5201ww
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机在现代社会影响的迅速扩大,传统的基于鼠标和键盘的人机交互技术越来越显示出它们的局限性,所以研究多模式人机接口技术在现实生活中变得越来越重要。手语识别作为多模式人机接口领域的一项重要组成部分,已经吸引了越来越多的专家和学者们的注意。  手语的建模包括建立理论模型和计算模型。理论模型关注的是理论上对手势手语功能的理解。理论模型根据实验或假设,对手势手语相关问题进行归纳和总结,进而为计算模型提供有价值的指导。这些研究为建立手势手语计算模型提供了良好的材料,许多计算模型以这些理论模型为基础。手语识别作为计算模型中的重要内容,其目标就是通过计算机提供一种有效的、准确的机制将手语翻译成文本或语音使得聋人和听力正常人之间的交流变得更方便、快捷。  理想的手语识别应能处理大量的、一般既定的词汇;最大可能地满足使用者的移动需要;实时准确、在复杂环境下鲁棒地进行识别,并且这种识别应该面向真正的、非特定的操手语者。目前非特定人大词汇量手语识别与特定人系统相比还有较大的差距,造成这一差距的原因包括数据本身的差异性矛盾与训练样本的缺乏。数据差异性矛盾使得非特定人手语识别中提取手语数据有效的共同特征非常困难。训练样本缺乏,使得在实际应用中模型的表达能力与样本缺乏之间的矛盾已经成为制约识别系统效果的瓶颈。这些问题的解决将对中国手语识别及其他相关领域具有非常重要的意义。  针对这些问题,本文的主要研究目的是探索原始训练样本缺乏情况下分类器与训练数据集的设计,以及手语数据差异性的分析与处理,从而给出了解决问题的策略与思路。具体的,本文的主要研究内容概括如下:  (1)在原始训练样本缺乏情况下分类器与训练数据集设计方面,提出基于mean-shift的动态手势手语合成策略及合成数据驱动方法,利用mean-shift算法可以方便、快捷地得到密度函数梯度的变化方向,从而控制衍生的方向和强度。我们设计的基于mean-shift的动态手势手语合成策略可以从向内衍生和向外衍生两种方式考虑,分别对应数据的泛化和异化过程。生成数据的过程不是随机的,而是自觉的遵守了对数据差异性的选择,这正是算法本身优越性的所在。生成过程对手语不同时刻、不同组成部分的数据处理强度
其他文献
低密度校验码(LDPC)是一种能逼近Shannon容量限的渐进好码,其长码性能甚至超过了Turbo码。由于低密度校验码具有译码复杂度低、错误平层低等诸多优点,它在信息可靠传输中的良
随着Internet和移动通信在全球的迅速发展和普及,移动计算模式的兴起,无线数据广播技术越来越成为一个重要的研究热点。无线数据广播是无线环境中的基本数据访问方式之一,可
管理信息系统(Management Information System,MIS)经过不断的发展,极大的方便了部署这些应用的企业提高工作效率和服务水平。但是,随着应用系统的增加,各个应用系统之间需要
基于构件的软件开发是解决软件危机的有效途径。在基于构件复用的软件开发过程中,构件库管理系统扮演了重要角色。在构件库管理系统中构件的表示及其检索是最基本也是最核心
在计算机科学领域,本体被定义为共享概念模型的形式化规范说明。应用本体的主要目的是为了知识共享和复用。因为本体的构造还没有一个统一的标准,所以在同一个领域内产生了大
随着数据库技术的迅速发展以及数据库管理系统的广泛应用,应运而生了数据挖掘技术。通过数据挖掘我们可以找到对于商业销售及生产极为有效的一些信息,从而可以提高销售和生产
数据挖掘是当前KDD中的一个重要领域,而关联规则挖掘是数据挖掘应用最广泛的技术之一。现有的关联规则挖掘算法和模型主要是基于数据库或数据仓库的,采用集中式处理。随着分
图像在成像、数字化、压缩和传输等过程中难免受到各种干扰,形成噪声。为了使图像的后续应用得到更好的结果,在处理图像前一般都要进行降噪预处理。现有的图像去噪方法大致可
在工业控制领域,多总线共存的现状使得不同总线网络中的设备无法通讯。同时,工业现场的低速总线网络也很难与高速的企业管理网络进行融合,不利于生产过程的监控与管理。如果
GPS导航系统已经成为美国军事基础设施的一个基本组成部分,尤其在精确打击武器方面有着广泛的应用。作为GPS的军方支持者,美国更是在其逐步推进和实施的GPS现代化建设中阐明了