基于变换域的语音信号处理新算法研究

来源 :华南理工大学 | 被引量 : 0次 | 上传用户：ycgwx

【摘要】

：

本文从应用最广泛的时频变换入手，采用传统傅立叶变换基来对语音信号进行分析和处理。在此基础上深入分析了翘曲傅立叶变换(WarpedDiscreteFourierTransform，WDFT)，使之与被分析

【作者】

：

曹燕

【机构】

：

华南理工大学

【出处】

：

华南理工大学

【发表日期】

：

2005年期

【关键词】

：

离散傅立叶变换离散傅立叶变换翘曲离散傅立叶变换翘曲离散傅立叶变换语音信号处理语音信号处理语音识别语音识别语音合成语音合成

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

本文从应用最广泛的时频变换入手，采用传统傅立叶变换基来对语音信号进行分析和处理。在此基础上深入分析了翘曲傅立叶变换(WarpedDiscreteFourierTransform，WDFT)，使之与被分析的语音信号的频率特性相结合，通过选择翘曲参数，既可以使待处理信号重点频段的频谱精度大幅提高，又可以保持信号非重点频段的频谱精度的基本要求。并且充分利用语音信号在Bark域和Mel域上的声学特性，提出了一些基于变换域的语音信号处理的新算法。　　1.HMM模型是语音识别中非常有效的工具，它可以通过状态的划分来描述语音中准平稳段，其状态所对应的语音单元可以从句子到音素。本文在重点介绍了HMM模型的基本理论和语音特征PLP(PerceptuallybasedLinearPrediction)之后，结合WDFT对语音信号分析所具有的突出优势，提出了一种基于WDFT的语音识别新算法，并给出了新算法的实现流程。这种新算法是通过在频域中非均匀地抽取频谱来获得PLP语音特征的。为更好地拟合频域上非均匀分布的Bark滤波器组(FilterBark，FB)，可以筛选出合适的翘曲参数，提高语音信号低频段的频率精度，使之更符合人耳的听觉特征。这种新算法比传统PLP算法更适用于语音识别中比较困难的易混淆音的识别，从而能达到更高的识别率。　　2.在对PLP特征作出改进之后，本文又提出了一种基于WDFT的语音识别新算法，即WDFT-WFBA-MFCC算法。考虑在一阶全通翘曲函数中选取适当的翘曲参数，便可以很好地拟合MFCC算法中非均匀分布的Mel滤波器组，大大提高语音信号低频部分的频谱分辨率，又不丢失高频部分的信息，更符合人耳的生理心理特征，所以运用WDFT到MFCC算法中去改进频谱选择。同时为提升Mel三角滤波器的能量差分度，在取得各个滤波器的对数能量后再运用一组加权滤波器来进行加权滤波器组分析(WeightedFilterBankAnalysis，WFBA)。将本文所提算法应用到TIMIT连续语音数据库中DR1音素的识别，得到的结果表明：新算法较传统的MFCC算法有更高的识别率。若新算法与高效的WDFT快速算法相结合，可在保持较高识别率的同时，大大降低计算复杂度。　　3.在研究了基于变换域在语音识别中的改进和应用之后，本文又通过分析语音相位在Bark域的听觉特性，把这种听觉特性运用到基于正弦模型语音编码合成元音的相位处理中，只通过幅频信息和少量的原始相位信息来合成重建语音信号，实验结果表明这种方法能改善合成信号中帧与帧之间的不连续性，使帧与帧之间能平滑过渡，增加语音自然度，提高语音的合成质量。

其他文献

四种甲基溴替代技术的综合评价

甲基溴作为一种熏蒸剂，在农业上有着广泛的应用。但作为一种受控制的ODS物质，己被列入淘汰时间表。我国是《蒙特利尔议定书》的缔约国，对甲基溴的淘汰承担着重要的责任和义务。

学位

甲基溴熏蒸剂土壤肥力士传病害土壤健康

数据集成中的自动模式匹配方法研究

数据集成是指集成自治、异质的数据源中的数据，为用户提供一个统一全局模式，实现数据共享的问题。数据集成通常有两种实现技术：虚拟(virtual)技术和仓库(warehousing)技术。两种

学位

数据集成模式匹配数据处理数据仓库数据映射

基于视觉词包算法的SAR图像分类方法及应用研究

合成孔径雷达(Synthetic Aperture Radar, SAR)由于其全天时、全天候以及穿云透雾观测的独特优势，在对地观测领域起着不可替代的重要作用，并且被广泛应用在目标识别，土地覆盖，海

学位

合成孔径雷达图像分类技术极化误差视觉词包算法

基于MPEG-4标准和ADSP-BF533实现的无线视频终端技术的研究

摘要※　　无线视频终端技术是无线视频研究领域重要的组成部分，不同的应用需求和不同的网络设施状况，决定无线视频终端的异构性，因此，本文只就其中关键技术进行研究。　　本文提

学位

无线视频终端无线视频终端视频编码视频编码容错处理容错处理抗误码效率抗误码效率

细胞核酸结合蛋白（CNBP）的功能研究

细胞核酸结合蛋白(cellular nucleic acid-binding protein，CNBP)是一个含有7个锌指结构(Cys-X-Cys-X-His-Xa-Cys，CCHC)的19kD蛋白，又称为锌指蛋白9(zincfinger protein 9，ZNF9)

学位

锌指蛋白转录调控细胞增殖蛋白质相互作用基因芯片细胞核酸结合蛋白多克隆抗体差异表达

隐私保护的图像检索关键技术研究

随着现代科学技术的发展，数字成像设备的普及，人们可以轻易容易的获取图像，并将其上传到网络。这就造成网络图像的飞速增长。而图像、视频数据中，往往包含有用户的人隐私信息，一旦

学位

图像检索隐私保护功能需求演示系统

基于移动多Agent的分布式网络性能监测的研究

随着现代网络规模的不断扩大，复杂性和异构性日益突出，给网络管理的理论和实践提出了新的要求和挑战。作为网络管理一项基本功能的网络性能管理也必须适应于现代网络发展的需要

学位

网络性能监测代理拓扑发现代理部署自适应

基于多光谱信息的高质量生物发光断层成像重建算法研究

随着医学影像技术的不断进步，现代医学成像技术和生物学发展十分迅速。分子影像作为一门新兴前沿的综合类学科，受到传统医学和计算机领域的充分重视。分子影像融合了分子生物化

学位

生物发光断层成像重建算法图像质量计算速度压缩感知法

基于贝叶斯网络的文本无关说话人识别研究

文本无关的说话人识别由于不限制话语内容,不存在被测说话人合作态度问题,数据的获取相对容易,具有很宽的实际应用范围.本文将贝叶斯网络的理论与说话人识别的技术相结合,提

学位

说话人识别文本无关贝叶斯网络基频特征

正心诚意寻师访友

寻师访友之路,乃是大道藏宝阁走向成功。大道藏宝阁创办伊始,便走上寻师访友之路。吴昌硕、齐白石、张大千、黄宾虹等先生的成功之路,无不指明,寻师访友之重要性,古人云:三行

期刊

一品青菜口感入口口袋龚贤黄宾虹八大山人石涛家花

基于变换域的语音信号处理新算法研究

与本文相关的学术论文