论文部分内容阅读
摘要:本文通过对说话人认证系统中的特征级融合、匹配分数级融合、决策级融合与多层级融合各种信息融合算法的研究,进一步提高了系统的认证精度,以便更好地解决关系国计民生的公共信息安全问题。针对各个融合层级发现的问题,本文分别从建立特征级融合理论、提出匹配分数级融合特征选择算法、提出多层级融合理论三个角度进行了研究。本文主要贡献有:1.本文按照信息融合生物识别系统中存在的特征级、匹配分数级与决策级三种融合层级,对现有信息融合说话人识别算法进行归纳,并对匹配分数融合说话人识别算法进行子类划分。然后,针对各融合层级遇到的问题与不足,具体工作有:2.针对特征层级存在的问题,本文提出了一种基于关系度量融合框架的特征级融合算法。以此关系度量框架为理论依据建立了一种基于特征级融合的说话人认证算法,通过引入最大Kullback-Leibler距离计算特征级融合的有效信息量,首次从信息论角度阐述了特征级融合优于说话人识别中常用的匹配分数融合的原因。实验结果显示特征级融合算法较传统匹配分数算法可以获取更多的有效信息量,得到了比匹配分数融合和单模态算法更优的性能。最佳情况下,特征级融合算法的等错误率比传统匹配分数融合降低了3.88%,比单模态算法降低了7.3%。3.针对匹配分数层级存在的问题,本文提出了一种基于Spearman相关系数的匹配分数融合特征选择算法。在匹配分数融合过程中,如何选择两种相关性较小的匹配分数是提高融合后系统性能的关键。目前业内缺乏衡量这种相关性的度量。本文首次引入Spearman相关系数来衡量匹配分数之间相关性,并且利用多项式曲线拟合Spearman系数分别与等错误率、MinDCF之间的关系,验证了该系数的有效性。进一步引入Kullback-Leibler距离分析了与Spearman系数之间的关系,再次验证了Spearman系数的有效性。通过Spearman系数对6种话语特征共15种两特征融合方案的匹配分数相关性的实验评估,进行了最优融合特征的选择,选出了MFCC与residual phase的最佳融合方案,并将Spearman系数与其它典型相关性度量进行时效性比较,验证其时效性最优,适合大量话语特征的快速选择。4.针对决策级融合存在的问题,本文首次提出了一种多层级融合说话人识别框架理论,在框架中分别定义了一种强多层级融合、三种弱多层级融合的四种多层级融合概念。针对两特征融合实例,分别讨论了以上四种多层级融合情况,提出了一种两特征的匹配分数、决策级融合多层级融合算法,验证了多层级融合理论的可行性。实验结果显示该算法性能均优于传统匹配分数算法、单模态算法。最优情况下,比传统单模系统等错误率降低了18.63%。