复杂情境下的说话人确认算法研究

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:gl24334119
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在说话人确认中,由于语音具有易变性,在说话情境(说话场景、通信信道)不同时,不管是主观听感还是客观频谱上,即使是同一个说话人的语音,都会表现出很强的差异性。如何针对不同情境的语音数据,提取出最具说话人个性的特征参数,建立鲁棒性的说话人模型,成为说话人确认领域的研究热点和难点。本论文针对实际环境下的说话人确认进行研究。   在特征提取过程中,声学特征仍然是区分性最高的参数。录制的语音数据中除包含有用语音信息外,还包括静音和背景噪声。高效快速地检测静音和从背景噪声中提取说话人信息,以及采用去噪的手段提高声学参数的鲁棒性,是提高说话人确认系统性能的关键所在。复杂情境下语音数据中存在“喷麦”现象和能量极低现象,传统基于能量的活动语音检测算法(VAD)针对这两种现象无法正确切分出语音帧和非语音帧。本文采用滤波器预处理和谱熵的方法分别处理上述两个问题。还采用基于MMSE_ LSA的语音增强算法,用于去除语音数据中的背景噪声。   在模型构建阶段,目前说话人确认任务中主流的联合因子分析算法(JFA),采用串行方式估计说话人空间和信道空间,不可避免地产生空间重叠现象。本文提出两种解决空间重叠问题的方法:基于施密特正交化的空间变换和基于信号子空间的空间变换。实验表明,采用这两种空间变换后,系统性能有一定的提升。   同时,对于复杂情境下变量空间更加多变的特性,全变量(Total Variability)算法更适合描述变量空间。本文提出通过空间拼接的方式得到全变量空间,这样既大大缩短空间估计时长,又保证系统识别性能。在此基础上还进行因子拼接,融合两种全变量算法中得到的全变量因子(i-vector)。在NIST SRE2008核心测试中的电话信道注册-电话信道测试任务上,相对基线系统,男声和女声测试的等错误率分别下降9.94%和5.70%
其他文献
随着无线通信技术的快速发展,其在人们的生活、工作中的应用十分广泛。近些年,随着无线传感器网络技术的提出,无线通信与传感器测试技术的结合更加紧密。然而,无线通信是离不开天
Turbo码自发明以来因其优异的性能被广泛应用,围绕Turbo码迭代译码收敛性分析和性能分析一直是编码界的热点研究问题。Turbo码的性能区域大致可分为瀑布区和错误平层区,对于
随着信息容量需求的快速增加,未来通信系统需要能够利用有限的频谱资源提供更多的通信业务、更高的通信速率和更好的通信质量。为了满足这一要求,对于光纤骨干传输网来说,单
论文依据对大地信道特性的分析,建立了弹性波透地通信平台,对弹性波透地通信系统多模分集接收方法进行了探讨。  论文针对弹性波在大地信道中复杂的传播环境提出了弹性波OFDM
超宽带穿墙雷达是一种能够探测到隐藏活动目标的新型雷达,在军事、反恐以及救灾等领域都具有难以估量的应用前景。它的这些应用也引导着超宽带穿墙雷达的不断发展。随着穿墙雷
合成孔径雷达(SAR)具有全天候、全天时、高分辨率的优点,无论在军事上还是民用中都具有非常重要的意义。将SAR和地面运动目标检测(GMTI)相结合,能够更好地监视场景中的静止和运动目
为了更好地开展武器弹药毁伤威力的评估工作,促进武器弹药的研制与发展,本文在LabVIEW平台下设计了毁伤威力场测试系统软件,配合本实验室研制的毁伤威力场硬件系统共同完成毁伤
光纤通信系统正朝着高速、宽带和大容量的方向迅猛发展。密集波分复用系统适应了这种发展需求,40Gbps的DWDM系统已经开始逐步商用。传输速率的提高,使系统的色散容限明显下降。
英语作为世界上使用范围最广的语言之一,它在中国与世界的沟通交流中发挥着至关重要的作用。然而英语中的语法学习对于英语学习者来说是一个困难而又漫长的过程,尤其在英语写作
随着无线通信的快速发展,超宽带UWB(Ultra Wide Band)技术已成为现代无线通信领域研究的热点。UWB技术具有短距离高速无线通信优势,UWB天线是超宽带通信系统中的重要组成部分,其