论文部分内容阅读
                            
                            
                                基于生物特征的身份识别技术是当前国际上的重点研究内容,自动说话人识别通过语音识别说话人的身份,在系统安全认证、司法鉴定、金融服务以及电子侦听等领域有着广泛的应用价值。本文在对现有说话人识别技术分析的基础上,运用互信息理论进行说话人识别的研究,提出了可实际应用的语音信号互信息计算方法,并针对基于文本和文本无关的说话人识别分别提出了相应的说话人语音模型和互信息匹配算法,实验证明了本文提出的语音信号互信息计算方法的有效性。    本文的主要研究内容如下:    一、对自动说话人识别原理以及相关的语音产生机理和语音信号处理方法作了全面的描述与分析。特别在特征参数选择与提取、说话人语音模型建立、模式匹配以及语音的声学特性方面进行了详细的分析。    二、从信息量的角度考察分析语音信号之间的特征相关性,提出随机干扰信号的概念来解释和描述语音信号之间的失真,并从随机信号的特征以及随机信号分析理论推导出这一信号的统计分布特性,最终,语音信号之间互信息的计算归结到随机干扰信号的熵并得到解决。    三、研究了语音信号互信息计算的具体算法,提出了基于模式的线性映射匹配算法LPM和非线性搜索匹配算法NLM。    四、对互信息测度的聚类特性进行分析,通过类内凝聚度、类间耦合度和类间重叠三大指标对互信息测度的分类特性进行了详细分析,并与其它常用测度Euclidean、Itakura-Saito和Mahalanobis进行比较,结果显示出互信息测度的模式分类有效性和优越性。    五、针对不同识别要求研究适合互信息测度应用的说话人模型,提出应用于基于文本的说活人识别的多模板模型MTM和应用于文本无关说话人识别的全特征矢量集模型CFC,实验证明这些模型能够充分表达说话人的语音特征。    六、对于文本无关的说话人识别,综合考虑距离空间和信息空间的特性,提出多级最小最大