有线电话网络环境说话人身份识别技术研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:wxws008
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
说话人识别是根据语音波形中反映说话人生理和行为特征的语音参数,进行说人识别的技术。它是语音信号处理的一个重要研究方向,作为一种生物认证技术,具有广泛的应用前景。 本文介绍了有线电话网络环境中说话人识别技术的原理与特点,分析了几种常用的语音数据预处理技术以及相关的语音特征参数的提取方法。研究了高斯混合模型在有线电话网络环境下与文本无关说话人辨识的训练与识别技术。结合独立向量分析、高斯混合模型与支持向量机的特点,给出了ICA-GVM组合话者模型。在该模型中利用独立向量分析对语音参数进行增强,使特征参数正交化,提高了不同说话人特征参数的区分度。将高斯混合模型对相同说话人语音特征参数概率分布的建模和支持向量机对不同说话人语音特征参数边界划分的建模结合起来,对两个模型的分类结果进行数据融合,将二者的优点结合在一起,提高了系统的识别率。通过在NIST语音数据库环境下进行测试,结果表明ICA-GVM组合话者模型较原高斯混合模型有更好的鲁棒性和自适应性。
其他文献
本文对代理签名及其应用进行了深入研究,主要成果及创新体现在以下几个方面: 1.匿名代理者的强代理签名方案  2.一种改进的代理多重签名方案本文提出一个改进的代理多重签
随着计算机的高速发展,一旦我们拥有了能够处理多量子比特的量子计算机,现有的许多密码方案就不再安全,所以我们要设计新的密码系统使之在量子环境下安全,关于格(Lattice)设计密码
本论文主要对可扩展标记语言(XML)的新的解析技术——基于虚拟令牌描述符(VTD)解析技术进行了研究。文中首先对XML产生背景和未来的发展趋势进行了介绍,分析了XML文档数据解
多输入多输出(MIMO)技术采用了多根发射天线和接收天线,能够在保持带宽或总发射功率损耗一定的条件下大幅度的提高系统的容量。TDD MIMO系统的特点是上、下行信道具有互易性,
超宽带通信具有优异的时间分辨力和大容量特性,能有效对抗多径干扰,同时超宽带系统发射功率低,非常适合复杂多径环境下短距离高速无线通信应用,因此超宽带成为通信领域近几年
大多数群组应用都基于不可信和开放的网络,现代密码体制和协议为实现通信数据的机密性、完整性和不可否认性提供了重要保障。在面向群组应用中,密钥的安全性是安全服务机制的基