论文部分内容阅读
滑音(portamento)指在演奏有音高乐器或歌唱时,以滑行的方式从一个音j平滑过渡到另一个音的过程。在此过程中,声音始终是完整的,不存在时间上间断或频率上跳跃的情况。由于滑音的应用既可以体现乐曲的特点及风格,又是演唱(演奏)者个性演唱(演奏)的体现,因此对滑音参数的正确估计对乐曲分类、演唱风格转换、歌手和演奏者的识别、歌声和伴奏的合成以及音乐信息标注的发展具有重要的意义。本文的主要目标是提取滑音信号的基频变化轨迹,主要包含两方面的内容:单音信号中滑音基频的估计以及多音信号中滑音基频的估计。由于乐音信号本身比较复杂,且滑音基频的估计又同时涉及乐音基频提取与非线性调频信号的参数提取两方面内容,因此,本文首先将滑音信号建模为一组调频参数具有整数倍关系的多分量非线性调频信号,并使用多种时频分析方法估计该仿真信号的基频变化轨迹。再根据实际滑音信号的特点,根据各时频分析方法获得的短时谱,通过谐波乘积谱(Harmonic Product Spectrum, HPS),突出滑音的基频。为测试本文的估计方法对实际滑音信号基频估计的有效性,选取了四种乐器的滑音作为测试对象。首先根据估计的基频合成滑音,再计算合成的滑音与真实滑音短时谱的互相关系数,以对比不同方法对各乐器滑音基频估计的正确性。然后,根据平均意见得分(Mean Opinion Score, MOS)测试,对合成的滑音信号进行评价,以比较不同方法对滑音基频估计的效果。实验表明,平滑伪Wigner-Ville分布(Smoothed Pseudo Wigner-Ville Distribution, SPWVD)与HPS相结合的方法能够在单音信号的滑音估计中获得更好的性能。多音信号中滑音基频的估计流程是在单音信号滑音基频估计流程的基础上设计的。由于在实际乐音信号中,两滑音同时出现的情况很少,且滑音的能量一般大于多音信号中其它乐音的能量,因此本文首先使用时频分析方法与HPS相结合提取滑音的基频变化轨迹,再通过使用多项式线性调频小波变换(Polynomial Chirplet Transform, PCT)中的旋转算子对混合信号进行解调,然后根据迭代谱减法从混合信号的频谱中依次移除滑音的各次谐波,最后估计剩余信号的基频,进而获得滑音及非滑音的基频。由于SPWVD无法通过逆变换恢复为原信号,因此在进行多音信号的滑音估计时,选择短时傅里叶变换(Short Time Fourier Transform, STFT)与HPS相结合的方法提取滑音的基频。经测试,本文设计的估计流程可以实现对多音信号中滑音及非滑音的基频估计。