论文部分内容阅读
近年来,声纹特征作为个人信息验证领域的研究热点发展迅速。目前,说话人确认系统在实验室环境中已可以达到相当高的识别准确率,但在现实情况中,由于噪声的干扰,系统的性能将受到严重影响,这大大妨碍了说话人确认技术在实际环境中的应用。本文提出了一种具有环境噪声感知功能的说话人确认系统。该系统采用具有抗噪性能的清浊音判决法提取出有效的语音段用于说话人特征的提取,采用特定环境噪声融合到背景模型中用于说话人模型的训练和调整,采用噪声识别算法判别出环境噪声类型用于说话人模型的选择。具体而言,在系统的训练阶段,首先为多种噪音建立其特定的背景模型,然后根据最大后验概率对说话人模型进行调整,从而最大限度地模拟噪声环境下说话人模型的状态,减少训练模型与测试环境之间的差异;在系统的测试阶段,首先对测试语音的环境噪声进行估计与识别,然后根据噪声的识别结果选择最相似的背景模型进行测试评分,以模型补偿的方式提高系统鲁棒性。此外,带噪的语音信号在进入说话人确认系统进行测试之前,首先根据其特征参数的特点,采用基于梅尔域的二次滤波的方法进行前端降噪,然后仅保留语音信号的浊音段作为特征参数提取的基础,从而进一步减少噪声对系统的影响。论文的仿真实验分别基于英文和中文语音库,选用多种不同噪音类型,在5dB的噪音环境下,比起传统算法,利用该技术可将等错误率最高减少26.38%,平均可减少16.44%,表明该系统在噪声环境下的说话人确认方面具有显著的优越性。