论文部分内容阅读
说话人识别是根据语音波形中反映说话人生理和行为特征的语音参数,进行说人识别的技术。它是语音信号处理的一个重要研究方向,作为一种生物认证技术,具有广泛的应用前景。
本文介绍了有线电话网络环境中说话人识别技术的原理与特点,分析了几种常用的语音数据预处理技术以及相关的语音特征参数的提取方法。研究了高斯混合模型在有线电话网络环境下与文本无关说话人辨识的训练与识别技术。结合独立向量分析、高斯混合模型与支持向量机的特点,给出了ICA-GVM组合话者模型。在该模型中利用独立向量分析对语音参数进行增强,使特征参数正交化,提高了不同说话人特征参数的区分度。将高斯混合模型对相同说话人语音特征参数概率分布的建模和支持向量机对不同说话人语音特征参数边界划分的建模结合起来,对两个模型的分类结果进行数据融合,将二者的优点结合在一起,提高了系统的识别率。通过在NIST语音数据库环境下进行测试,结果表明ICA-GVM组合话者模型较原高斯混合模型有更好的鲁棒性和自适应性。