【摘 要】
:
随着科学技术的飞速发展,人们的安全意识不断提高。传统的识别手段己不适应现代生活的需要,基于多通道混合特征的身份识别技术进入了迅速发展的阶段,其中,基于唇动的身份识别
论文部分内容阅读
随着科学技术的飞速发展,人们的安全意识不断提高。传统的识别手段己不适应现代生活的需要,基于多通道混合特征的身份识别技术进入了迅速发展的阶段,其中,基于唇动的身份识别因为采用了视听混合的识别方法(AVSR)取得了较好的识别效果。本论文主要研究的是基于唇动的身份识别的关键技术,主要研究工作如下:(1)唇动实验平台的搭建。本文搭建了一个稳定、合理的实验平台,所使用的视听化数据库是Tulips1,相应的噪音数据数据库是Aurora2.0。同时本文采用了第三方数据库OpenCV1.0作为图像处理开发的辅助工具,提高了开发效率。(2)科学的实验检验方法的设计。首先,本文设计了一种加入噪音的方法,以配合Aurora2.0数据库的使用。其次,本文较为细致地分析了多种实验效果评估的方法,并采用留一交叉错误率预测法作为本文的实验效果评估法。(3)唇动语音特征的提取。本文通过实验,比对了梅尔倒谱系数(MFCC)、感知线性预测参数(PLPC)、音量结合过零率(ZRC)三种语音特征的提取方法,并通过实验结果说明了最终采用梅尔倒谱系数的原因。(4)设计了一个多通道特征识别系统。本文提出了一种新的动态时间扭曲(DTW)识别的方法,该法融合了语音和图像两方面的特征进行识别,最后本文用实验证明了该方法的有效性。
其他文献
随着微博用户数量的快速增长,微博的炒作现象也越来越严重。“网络水军”和“网络推手”等利用微博散布谣言及虚假信息,严重干扰了网络秩序。目前,在对微博炒作的研究方面,主
随着遥感卫星技术的发展应用,遥感图像在日常生活和军事上具有重要作用。多光谱图像具有较高的光谱分辨率,光谱信息丰富,但由于物理器件的限制,空间分辨率较低,而全色图像具
号码携带系统主要是为了提供这样一种服务,用户可以随意更换手机服务的运营商,但是原拥有的手机号码不用改变。对于运营商内部的从2G到3G的携号转网可以通过自身的升级实现,
自然景物模拟在计算机图形学占有非常重要的地位,而且自然景观的三维模拟在电脑游戏、电影特效、虚拟现实等领域中使用得越来越频繁。虚拟模拟常用的方法有分形几何方法、纹
本文介绍了作者在跨函数分析研究方面所做的工作,包括跨函数分析技术的设计与实现以及对现有DTSJava(Defect Testing System for Java)系统的改进,将跨函数分析模块与区间运
P2P网络和SIP协议都是目前互联网技术的研究热点。SIP协议凭借其简单、易于扩展等诸多长处得到了越来越多的应用,但是现有的SIP系统大多都存在“单点失效”和“性能瓶颈”等
本文首先对Web日志挖掘的发展现状及存在的问题进行了系统性阐述,按Web日志挖掘的流程及相关技术进行了介绍和探讨。重点分析和研究了Web日志数据预处理、聚类分析技术以及算
随着计算机技术和互联网的迅速发展,各种信息呈爆炸式增长,人们对信息精确定位的需求促进了自然语言处理技术的发展。指代消解是自然语言处理的重点和难点之一,在文本摘要、
传统的单纯基于URL黑名单识别方式在今天海量的钓鱼网站面前以显得力不从心,必须配合其他识别方式才能很好地工作。随后出现了许多新的识别方法,比如基于网页结构的识别方法,
异构多处理器系统由一组具有不同处理能力的处理器构成,任务调度成为改进系统性能的关键因素。如何合理地将任务分配给不同处理器,使整个系统性能达到最佳,是任务调度需要解决的