论文部分内容阅读
语音信号的基音频率是一个非常重要的参数,广泛应用在听觉场景分析、单声道盲源分离、音律分析等语音和音频信号处理领域。目前,对于单独语音信号的单基音检测,已经得到了许多性能较好的算法。但是对于在同一时刻有多个话音的情况,即多基音检测变得非常困难。本文首先分析和研究了现有的单基音检测算法和多基音检测算法。通过对单独语音信号和混合语音信号的特性进行详细的分析,提出了基于谐波峰值提取的多基音检测算法。该算法在频域对语音信号进行分析,通过对频谱中峰值的选择得到信号的谐波分量,然后统计分析这些谐波分量之间的倍频关系,最终得到混合前两个信号的基音频率。另外,在算法中对语音信号采用清浊音判决技术进行预处理以减少算法的计算复杂度。本文算法采用C语言实现。测试结果显示,对于单独语音信号,浊音段的检测准确率为81.8%,清音段的检测准确率为90.2%;对于混合语音信号,浊音段的检测准确率为80.7%,清音段的检测准确率为90.8%。