不匹配信道下耳语音说话人识别研究

来源 :苏州大学 | 被引量 : 0次 | 上传用户:myg3801403
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
耳语音作为人类的一种辅助发音方式,在日常生活中起着较为广泛的作用,尤其是在金融领域,公安司法领域中各种身份的确认。说话者为了保证信息的私密性,常常会用到耳语音。正因如此,耳语音说话人识别也作为一个新的课题被提出来。耳语音主要是用在手机通话中,语音必然会受到信道畸变的影响。传统的识别模型遇到训练和测试的信道环境差异变大时,识别率就会大大受到影响。因此,必然需要一种稳健的信道补偿算法来增强这个说话人识别系统。为了解决这个问题,本文做了以下几个方面的工作:一、将各种信道的耳语音数据混合在一起训练通用背景模型(UBM),然后在此基础上进行最大后验概率(MAP)自适应获得说话人模型,将此模型和常规的GMM模型进行识别率的比较。实验证明,UBM模型优于普通的GMM。二、将联合因子分析(JFA)应用到耳语识别中,根据耳语数据库的特性,采取分开估计和省略残差空间的方法。具体在识别过程中,通过将训练所得的说话人因子和测试所得的信道因子相结合的方式,达到说话人不断适应测试信道环境的目的。实验结果显示修改后JFA的识别效果大大提升。另外,根据JFA在短时识别方面效果不理想,提出了一种在模型上保持说话人因子不变,而将信道因子用到特征方面,对每一帧特征矢量进行补偿的混合补偿法,该方法相对于JFA来说补偿的更为细致,实验显示HH信道训练时1s和2s平均识别率分别提高4.36%和3.89%,EP信道训练时1s和2s平均识别率分别提高4.14%和2.64%。三、根据支持向量机(SVM)的区分性,将说话人超向量输入到SVM中,结果系统性能不如UBM-MAP系统。这时将说话人因子矢量输入到SVM中,由于说话人因子在辨认系统中特征维数低,易线性可分,获得了良好的识别效果。然后经过三种信道补偿方法进一步去冗余,取得了和JFA相当的识别结果。
其他文献
随着中国现代化建设的快速发展以及城市化进程的加快,中国汽车保有量迅猛增加,停车难的问题随之出现。如何提高停车位的使用效率是停车管理亟需解决的问题。针对这一情况,提
摘 要:利用PRO/II流程模拟软件对生产中产生的甲醇-丙酮进行了萃取精馏模拟,在此基础上确定合理工艺参数,用于指导装置的建设和工业生产。  关键词:PRO/II 流程模拟 萃取精馏 甲醇 丙酮
在大数据时代中,为了从大量高维数据中挖掘出有用信息,变量选择已成为众多专家学者的首选。变量选择模型的结果应该具有稀疏性,传统的模型选择方法难以满足要求,Lasso等一系
随着计算机网络和数据通信技术的高速发展,人们对居住环境的要求不断提高,“信息化”的概念被引入到了住宅的建设当中,并由此掀开了家庭信息化和智能化的新篇章。随着各种新技术
几何尺寸测量是现代工业检测中的重要内容,基于计算机视觉的测量方法不仅能提升检测精度,而且能提高检测效率。物体边缘中包含着丰富的几何特征信息,因此论文以获取物体边缘
海洋环境噪声既是各种海洋声学系统的背景噪声干扰场,同时也携带着大量的海洋信息,因此海洋环境噪声研究无论在民用还是军用上均具有非常重要的意义。本文主要是基于潜标,同
学位
相位恢复是指仅利用图像的傅里叶幅值对原始图像进行恢复。由于傅里叶幅值中包含的信息量较少,当图像的过采样率相对较低时,传统的相位恢复算法无法实现图像的有效重构。因此
随着社会进步和人民生活水平的不断提高,人们已经不再满足有病才看医生的被动模式,他们更希望能在疾病爆发之前就得到预警。因此应用简单的家庭监护仪监测更多的人体生理参数信
无线局域网(WLAN)技术具有高带宽、低成本等优势,目前在短距离通信领域得到了广泛的应用。但是WLAN接入点的覆盖范围有限,节点移动速率受到极大的限制,这给无线网络的部署带