论文部分内容阅读
语音信号是一种典型的时变信号,正是这种非平稳性携带丰富的信息。准确地对语音信号进行建模表示是语音编码、语音压缩、语音识别等后续处理的前提和基础。时频分析理论和方法可以对信号在时域和频域同时分析,它是分析非平稳信号的有利工具,近年来已成为信号处理等领域的一个研究热点,它也为语音建模提供一个新的理论和方法,因此,研究语音信号的时频建模有着理论意义和应用价值。本文针对语音信号的时频建模进行了研究,具体研究工作如下:首先,提出小波多分辨率的正弦谐波谱语音建模。传统正弦谐波谱模型存在帧长固定问题,不能使信号的每个谐波成分获得最佳分辨率,造成重构语音谱失真严重,小波变换具有多分辨率特性,与正弦谐波谱模型相结合,解决了固定帧长的问题。小波变换将语音信号分成如若干个不同频率的子带信号,然后利用正弦谐波谱模型对各个子带进行独立分析,最后合成重建,实现语音信号时频建模。仿真实验显示该模型的信号重构误差比传统模型降低约两个数量级,通过PESQ测试得到的MOS分值约提高0.3。其次,研究基于改进S变换的语音信号时频分析。S变换为短时Fourier变换和小波变换的一个结合体,针对语音信号选择合适的母小波,对S变换进行改进,得到一种改进的S变换,最后利用改进S变换对语音信号进行时频分析。仿真实验与短时Fourier变换和小波变换两种时频方法比较,结果显示由改进S变换得到语音信号的时频结构更加细致。最后,提出基于小波字典的匹配追踪算法的语音信号时频建模。匹配追踪核心思想是寻找最佳匹配原子,首先选择Daubechies小波原子组成匹配追踪的原子字典,然后利用匹配追踪算法将语音信号分解成若干个最佳匹配的小波原子,将最佳匹配的小波原子进行累加,实现语音信号的重构。仿真实验通过与基于正弦字典的匹配追踪算法的结果对比,验证了基于小波字典的匹配追踪算法的有效性和优越性。