论文部分内容阅读
本文对说话人确认中背景模型进行了研究。主要内容如下:
1.在电话信道的语音库上,建立了与一个与文本无关的说话人确认系统,即GMM-UBM系统。通过实验确定了在本文采用的数据库条件下,训练GMM模型的最佳语句和最佳混合分量个数。
2.通过对背景模型和GMM模型的研究,提出了一种基于高斯分布的背景模型(GBM)。该模型根据高斯分布的空间特性,利用其均值矢量和协方差矩阵的性质为每个目标说话人的合成一个背景模型。其充分利用了每个目标说话人的GMM模型,减小了计算量和对存储空间的要求并且可以达到与UBM相当甚至更低的等错误概率。最后根据利用目标说话人的GMM模型中主要高斯分布的特性,提出了一种减小计算量的方法。
3.通过对背景模型的分析,提出了一种将UBM和CHM/GBM相结合的判决方法。对测试句进行判决时,先利用UBM模型将判决空间分成两个区域,对于落入不确定区域的测试句,启用相应的CHM/GBM重新做出判决。