【摘 要】
:
语音可懂度增强属于语音增强领域比较新的一个子领域,相比于背景噪声和其他干扰的增强领域,可懂度更关注于语音本身因较低速率编码而带来的失真,就语音质量这一问题,提供了一
论文部分内容阅读
语音可懂度增强属于语音增强领域比较新的一个子领域,相比于背景噪声和其他干扰的增强领域,可懂度更关注于语音本身因较低速率编码而带来的失真,就语音质量这一问题,提供了一种不同的角度。是通过对语音信号本身的处理,提高其质量。从而增强它抗干扰的能力。本文的研究初衷是出于要解决2.4bit/sAMBE与16kbit/s CVSD级联编码时出现的语音可懂度下降的问题,低编码速率造成了语音畸变。语音的信息在低速率编码下肯定部分会损失。尤其是在一些语音过渡段(也可以称为是语音非平稳段,通常发生在元音与辅音的交界处,或者语速较快时的辅音段)。这种现象由两种解释:一、低速率编码无法捕捉语音过渡段的快变的这种非平稳特性。在模型参数估计和模型建立的过程中扭曲或丢失了过渡过程中的信息。二、在发音时,这些过渡段的发音能量远小于邻近元音的能量,由于听觉掩蔽效应[22],这些过渡段淹没在元音能量里。而编码器更会加重这种症状。所以,我们的语音可懂度增强会主要针对以上提到的两个问题提出相应的解决方案。解决方案主要分为三大框架:语音段检测;语音段扩压;能量放大;本文的研究包含了在这几个领域现有算法的研究,将这些算法集成到我们的系统中,在此过程中发生的工作量主要在算法评估性的研究和集成前的改进上。例如,基于梳状滤波器的基音估计的语音段检测技术的提出,将谐波匹配度作为语音段检测的似然函数,并在此基础上提出经能量加权的改进版本;分离出针对语音平稳段的扩压技术和语音非平稳段的扩压技术;起始时间估计模块的价值性(讨论其有无对系统的影响);HNM中谐波分量和非谐波分量的分离技术评估改进;最后,通过5段normal speaking的语句材料进行了仿真测试。表明了最终的集成系统有助于改善语音信号的可懂度。
其他文献
便携计算设备的大量涌现,和人们希望与互联网建立不间断通信的需求,促进了对IP移动性技术的研究。当前解决IP网络移动性管理的标准是移动IP协议。移动IP技术可以使网络节点在
随着网络服务快速发展,客户对网络服务品质的要求不断提高,运营商发现客户价值基于网络的分量在不断下降,而基于内容和服务的分量则需要它们投入更多的精力来体现和其它运营商之
谐波和噪声成份的比值(Harmonic to Noise Ratio, HNR)在很大程度上反映了声音的嘶哑程度,是判断喉部疾病的一个主要特征。在语音声学和喉病检测等领域中有着重要的意义。本
随着数据库的迅速发展,网络及其他信息技术的广泛应用,生产生活中存储的数据量迅速增加。数据挖掘作为一种在大量的数据中寻找有价值信息的数据分析工具,受到越来越广泛的关
可否认认证协议是一种特殊的认证协议,它允许消息的接收方认证发送方的身份,但不能向任何第三方证明消息来源。这种认证协议不仅能够在高压政治下给电子选举方案提供投票自由
数字电视机顶盒已从最初单纯的数字电视信号接收向多功能特性转变。随着数字电视机顶盒芯片性能的不断提升,机顶盒功能不断增加,用户需要存储节目内容的需求越来越多。传统的
当今,移动通信正处于向第四代通信系统发展的阶段,OFDM技术作为第四代数字移动通信(4G)系统的关键技术之一,被包括LTE在内的众多准4G协议所采用。IDFT/DFT作为OFDM系统中的关
随着移动和互联网时代的到来,移动社交网络在人们生活之中所发挥的影响力与日俱增。移动设备用户可以利用社交网络上的各种应用和功能,在任何场景下与其他人进行交流互动。同样
随着全球企业间的合作更加频繁,企业与客户间的联系更加广泛、紧密,需要更方便、经济的网络支持。虚拟专用网VPN技术的成功引入可以从根本上满足企业用户的低通信费和高灵活
近年来,随着网络技术及多媒体应用的不断发展,对于视频编码技术的研究不再仅仅局限于压缩特性。由于用户终端的多样性和网络条件的异构性,用户对视频的分辨率、帧率、质量等