论文部分内容阅读
本文介绍了一种基于MFCC倒谱特征和GMM-UBM模型的稳健说话人识别系统,旨在基于当前主流技术的基础上进一步改进系统识别率和噪声鲁棒性,因此本文仅对低层次的声学特征进行提取和建模,并对系统的前端处理进行了如下改进:提出基于子带能量和基频检测的语音检测算法;使用CMVN特征归一化方法提高MFCC倒谱特征的抗噪声干扰性能;证明了对数能量特征在说话人识别系统中的无效性;探讨了SDC动态特征在说话人识别系统中的应用。在 NIST的说话人验证评估集上进行了测试,改进后的系统的错误率比基线系统降低了约26%。