噪声鲁棒性前端方法研究

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:yweifeng
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本论文的研究主题是语音识别的前端鲁棒性问题。语音识别是为了能让计算机明白人的自然语言,经过儿十年的努力,现在已经发展出了不少比较成熟的系统,这些系统在实验室环境下(比较理想的环境下),语音识别的识别率(无论是大词汇量连续语音识别,还是是数字串或者命令词的识别)取得了很高的识别率。然而,在实际环境中,因为环境噪声的存在以及信道的影响,说话人情绪,状态等因素的影响,使得识别率在实际环境下急剧下降,简直到了不能容忍的地步。综合目前的各种情况,语音识别如果要大规模走向实用,前端鲁棒性的突破是一个关键因素。本文尝试从不同方面,对语音识别的前端鲁棒性问题的研究做了一些有益的探索。 语音识别的噪声鲁棒性方法从大的方面可以分为前端方法和后端方法2个方面。前端方法主要着眼于消除噪声对语音特征的影响,或者提取具有抗噪声性能的语音特征,后端方法主要着眼于使得已经训练得到的系统具有更大的适应性和宽容性,或者能够适时调整系统模型,使得模型能够动态跟踪不断变换的环境,取得最好的识别效果。 文章首先对语音识别的历史,现状,面临的难题以及实际应用等方面的情况进行了比较翔实地叙述。 鲁棒性问题方面的方法很多很杂,每一种方法都有它的的特点和适用范围,而且至今缺乏一种能对所有鲁棒性问题都比较有效的方法,针对这种情况,论文在第二章对鲁棒性前端问题进行了比较全面的归纳和总结。 论文在第三章用LDA方法在Aurora2数据库上面进行了提高噪声鲁棒性和降低运算量方面的应用。事实上,如果一个语音识别系统要取得很好的识别效果,一般来说都要包括区分性训练的成分,而LDA方法能满足这种要求。 第四章详细讲述了一种新的前端特征提取算法,即翘曲离散傅里叶变换在前端特征提取中的应用,该方法模拟了人的耳朵对高频分量和低频分量具有不同的分辨率这个特点。在第五章里面,针对实际的工程使用需要,对一些性能比较好的前端方法尤其是双高斯方法进行了他们的on-line方法实现。 第六章介绍了经典的儿种语音特征规整方法在Aurora2数据库上面的测试情况。论文第七章首先简要介绍了ETSI颁布的分布式语音识别(DSR)前端标准,并在此基础上进行了维纳滤波和特征规整方法结合的实验。
其他文献
目的:观察米索前列醇联合缩宫素预防产后出血的临床疗效。方法:选择2014年1月~2015年12月收治的123例足月阴道分娩的产妇,分别采用米索前列醇400μg联合缩宫素10U(观察组,n=62)或缩宫
目的:为了提高老年人口腔保健的意识和能力,探讨老年人口腔保健的有效方法及其作用。方法:从老年人常见的口腔问题入手,进而阐述了老年人口腔保健的常用方法。结果:老年人口腔保健
光载射频通信(RoF,Radio Over Fiber)将移动通信和光纤通信相结合,实现了两者优势的相融合,相对传统的射频通信系统,其在带宽、损耗、抗电磁干扰等方面具有相当强的优势,在近
多媒体及网络技术的飞速发展使得多媒体应用越来越广泛。但是人们在享受多媒体技术带来便利的同时也遇到了一些问题,诸如,多媒体数据的任意复制、篡改、非法访问以及传输带宽不
目的:探析肛肠术后疼痛采用中药坐浴治疗的临床效果。方法:选择行肛肠手术患者94例为研究对象,按照随机数字法分为两组,其中给予对照组常规治疗,而观察组则运用中药坐浴治疗,比较治
未来的通信网络将是一个包含多种不同接入技术的异构网络,能针对不同的用户需求提供不同的服务。同时随着多媒体业务量的爆炸式增长,特别是高清视频业务的广泛应用,单网络带
本文对MIMO技术做了研究,主要工作如下:  首先介绍了容量的发展背景,分析了固定信道、遍历衰落信道和非遍历衰落信道的容量和中断概率。  对MIMO中继信道容量做了研究,首先分
现阶段IP 地址描述了一台主机在网络中的物理位置,这个地址信息用于从源端到目的端的路由,但同时IP 地址又是网络中主机身份的标识。正是IP 地址的这种双重身份使得现在的IP
目的:通过对喀什地区泌尿系结石成分分析及其资料进行分析,进一步探讨喀什地区泌尿系结石成分特点及其相关的因。方法:回顾性分析2013年7月至2016年6月收治的590例泌尿系结石患
目的:探讨核苷类药物在乙型肝炎肝硬化治疗中的应用效果。方法:根据患者自身条件将我院收治的100例患者分为对照组和治疗组,观察两组治疗效果。结果:治疗组患者的ALT,AST,HBV-DNA等