语音可懂度增强方法研究

来源 :电子科技大学 | 被引量 : 0次 | 上传用户：vsrabbithhf

【摘要】

：

语音可懂度增强属于语音增强领域比较新的一个子领域,相比于背景噪声和其他干扰的增强领域,可懂度更关注于语音本身因较低速率编码而带来的失真,就语音质量这一问题,提供了一

【作者】

：

肖艳

【机构】

：

电子科技大学

【出处】

：

电子科技大学

【发表日期】

：

2009年期

【关键词】

：

语音段检测语音段自适应性速率扩压能量放大谐波匹配度起始时间估计非平稳段的扩压技术

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

语音可懂度增强属于语音增强领域比较新的一个子领域,相比于背景噪声和其他干扰的增强领域,可懂度更关注于语音本身因较低速率编码而带来的失真,就语音质量这一问题,提供了一种不同的角度。是通过对语音信号本身的处理,提高其质量。从而增强它抗干扰的能力。本文的研究初衷是出于要解决2.4bit/sAMBE与16kbit/s CVSD级联编码时出现的语音可懂度下降的问题,低编码速率造成了语音畸变。语音的信息在低速率编码下肯定部分会损失。尤其是在一些语音过渡段(也可以称为是语音非平稳段,通常发生在元音与辅音的交界处,或者语速较快时的辅音段)。这种现象由两种解释:一、低速率编码无法捕捉语音过渡段的快变的这种非平稳特性。在模型参数估计和模型建立的过程中扭曲或丢失了过渡过程中的信息。二、在发音时,这些过渡段的发音能量远小于邻近元音的能量,由于听觉掩蔽效应[22],这些过渡段淹没在元音能量里。而编码器更会加重这种症状。所以,我们的语音可懂度增强会主要针对以上提到的两个问题提出相应的解决方案。解决方案主要分为三大框架:语音段检测;语音段扩压;能量放大;本文的研究包含了在这几个领域现有算法的研究,将这些算法集成到我们的系统中,在此过程中发生的工作量主要在算法评估性的研究和集成前的改进上。例如,基于梳状滤波器的基音估计的语音段检测技术的提出,将谐波匹配度作为语音段检测的似然函数,并在此基础上提出经能量加权的改进版本;分离出针对语音平稳段的扩压技术和语音非平稳段的扩压技术;起始时间估计模块的价值性(讨论其有无对系统的影响);HNM中谐波分量和非谐波分量的分离技术评估改进;最后,通过5段normal speaking的语句材料进行了仿真测试。表明了最终的集成系统有助于改善语音信号的可懂度。

其他文献

分层无线IP代理模型及其AAA认证方法

便携计算设备的大量涌现,和人们希望与互联网建立不间断通信的需求,促进了对IP移动性技术的研究。当前解决IP网络移动性管理的标准是移动IP协议。移动IP技术可以使网络节点在

学位

移动IP认证微移动AAA

以SLA为中心的网络运行监测系统——重点服务器监测的研究与实现

随着网络服务快速发展，客户对网络服务品质的要求不断提高，运营商发现客户价值基于网络的分量在不断下降，而基于内容和服务的分量则需要它们投入更多的精力来体现和其它运营商之

学位

SLA网络服务网络运行监测系统服务器监测IP网络性能服务等级协定

嗓音源谐波噪声HNR分离方法研究

谐波和噪声成份的比值(Harmonic to Noise Ratio, HNR)在很大程度上反映了声音的嘶哑程度,是判断喉部疾病的一个主要特征。在语音声学和喉病检测等领域中有着重要的意义。本

学位

谐波噪声比动态时间规整FastICALipschitz指数

序列固有模式理论与应用

随着数据库的迅速发展,网络及其他信息技术的广泛应用,生产生活中存储的数据量迅速增加。数据挖掘作为一种在大量的数据中寻找有价值信息的数据分析工具,受到越来越广泛的关

学位

序列固有子序列模式固有趋势子序列模式异常检测系统调用Windows Native APIECG

非交互式可否认认证协议的研究

可否认认证协议是一种特殊的认证协议,它允许消息的接收方认证发送方的身份,但不能向任何第三方证明消息来源。这种认证协议不仅能够在高压政治下给电子选举方案提供投票自由

学位

双线性对可否认认证代理签名指定验证者签名

多种嵌入式平台通用USB2.0协议栈的研究与设计

数字电视机顶盒已从最初单纯的数字电视信号接收向多功能特性转变。随着数字电视机顶盒芯片性能的不断提升,机顶盒功能不断增加,用户需要存储节目内容的需求越来越多。传统的

学位

机顶盒USB2.0嵌入式系统ST-LinuxST-OS21

LTE系统中基带DAGC的应用研究及FPGA实现

当今,移动通信正处于向第四代通信系统发展的阶段,OFDM技术作为第四代数字移动通信(4G)系统的关键技术之一,被包括LTE在内的众多准4G协议所采用。IDFT/DFT作为OFDM系统中的关

学位

长期演进正交频分复用数字自动增益控制FPGA实现

移动社交网络中保护隐私的朋友匹配研究

随着移动和互联网时代的到来，移动社交网络在人们生活之中所发挥的影响力与日俱增。移动设备用户可以利用社交网络上的各种应用和功能，在任何场景下与其他人进行交流互动。同样

学位

移动社交网络隐私保护朋友匹配陌生用户安全分析

面向虚拟专用网的光传送网流量疏导及组播保护方法研究

随着全球企业间的合作更加频繁,企业与客户间的联系更加广泛、紧密,需要更方便、经济的网络支持。虚拟专用网VPN技术的成功引入可以从根本上满足企业用户的低通信费和高灵活

学位

VPN流量疏导组播树保护

可伸缩视频编码与多视角视频编码的差错控制方法研究

近年来,随着网络技术及多媒体应用的不断发展,对于视频编码技术的研究不再仅仅局限于压缩特性。由于用户终端的多样性和网络条件的异构性,用户对视频的分辨率、帧率、质量等

学位

可伸缩视频编码多视角视频编码差错控制冗余图像视差映射错误弹性错误隐藏

语音可懂度增强方法研究

其他学术论文