语音特征波形的非负矩阵分解研究

来源 :北京工业大学 | 被引量 : 0次 | 上传用户:wtrgo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对目前传统的特征波形(Characteristic Waveform,CW)分解方法很难在分解精度、计算复杂度、延时这三个指标上达到统一的缺点,本实验室已经有人提出利用非负矩阵分解(Nonnegative Matrix Factorization,NMF),来分解CW,并且产生了基于非负矩阵分解的波形内插(Waveform Inerpolation based on Nonnegative Matrix Factorization,NMF-WI)编码器,但是原NMF-WI模型存在收敛速度慢,基矩阵不够稀疏等缺点,模型还不够成熟,有一些待改进的地方。 本文在此基础上针对NMF-WI语音编码模型和相位合成等关键技术进行了深入的研究,提出了一系列改进算法,并最终提出了2kbps改进型NMF-WI语音编码方法。本文的改进主要体现为如下几方面: 一、采用基于K-L散度的NMF方法分解CW,与原方法相比,绝对误差下降了约1/3,计算复杂度也大大降低; 二、提出了一种收敛速度更快的基矢量Mel刻度分带初始化方法,得到的基矩阵更稀疏,冗余度更低,与原方法相比,更符合语音的感知特性; 三、为了降低计算复杂度,按照基音周期的统计分布将CW分为6类,在绝对误差没有降低的情况下,平均收敛速度提高了30%; 四、提出了两种分解阶数的计算方法,增强了原来实验方案的理论基础,得到了更加合理的分解阶数,降低了计算复杂度,而绝对误差没有明显提高; 五、提出了一种相位谱的混合自回归合成方法,将相位谱分解为随机相位和固定相位的加权和,与原NMF-WI模型采用固定相位合成的方法相比,有效改善了合成语音有很强蜂鸣声的缺点,提高了合成语音的自然度; 六、开发出一套改进型2kb/s NMF-WI低复杂度语音编码方法,在CW分解模块,复杂度下降了10MOPS,语音质量比原NMF-WI编码器高,与采用4bit散布矢量量化相位谱的2.16kb/sNMF-WI语音编码器的语音质量相当。
其他文献
1介绍rnMeta分析和多重回顾均显示,在继续医学教育活动中应用互动性和审核/反馈技术,可以最有效地改善医师诊疗水平和患者疗效.在临床的早查房中,往往先举出一个病例,持有不
两栖动物的皮肤作为与环境直接接触的器官,在调节体温、繁殖、呼吸、调节水平衡等方面起到了非常重要的作用。同时也是抵抗环境污染、防御紫外线损伤等的重要屏障。不同类群在
脑电信号包含了大量的脑内神经元活动信息,同时也包含了来自人体其他器官组织产生的生物电信号(如心电、肌电和眼电等)以及各种外界因素引起的干扰信号。对脑电信号处理的目的就是从复杂的背景噪声中分离出有用信号,进而研究脑电信号在不同脑功能状态下的特征。本文以统计信号处理理论和统计物理学为基础,针对现有传统信号分析方法的不足,研究混合信号中独立分量提取的相关理论和计算方法;应用DFA (detrended
本文通过对荣华二采区10
期刊
干热河谷是我国西南地区的特殊生态系统类型,生态退化严重,是我国典型生态脆弱区。干热河谷中降水少蒸发量大,季节性干旱极为严重,水分胁迫是最突出的生态和环境问题,因而本文从稳
限制CMOS图像传感器性能的一个主要问题是其有限的动态范围。本文以CMOS图像传感器动态范围扩展技术为核心,对常见的动态范围扩展技术进行了深入的研究,并进行了创新。提出了一
已有的研究表明,体细胞(somatic cell)和诱导多能干细胞(induced pluripotent stem cell)的线粒体数量和主要的供能方式差异巨大:体细胞具有数量丰富、嵴结构成熟的线粒体,主要
光电子器件的发展与应用推动着光通信系统的进步,SOI(Silicon on insulator)光波导技术具有优异的电学和光学性能,并且与成熟的硅基CMOS工艺完全兼容,是发展低成本光子集成回
摄影艺术家吴奎仕先生,五十年前在部队就热衷摄影创作,对风光摄影情有独钟。他的作品,力求表现自然和艺术的和谐统一,把对形式美的追求与自然形态的朴素融为一炉,其作品有动、有静、有情、有韵,在情与景的交融中洋溢着诗情之美,令人赏心悦目。
随着计算机技术、通信技术和微电子技术的进步,嵌入式技术取得了迅猛的发展。从MP3、PDA这样的小型数字产品,到智能家电、数控机床,嵌入式技术迅速渗透到各行各业。计算机网