基于GMM和高层信息特征的文本无关说话人识别研究

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:dudulee
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为了考察和衡量文本无关的说话人识别的最新研究发展状况,美国国家标准与技术署(NIST)自1996年起开始举办说话人识别评测(SRE)。NIST说话人评测代表了了说话人识别领域的最先进水平,NIST设立了多项任务,探索和研究不同语音条件下的研究方法,并为各个项目提供统一的电话语音数据(多通道、多环境、说话人规模大)、测试平台、评测规则,以及评估标准。其中,采用长语音的说话人识别项目旨在利用语音信号中的高层次信息用于文本无关的说话人识别的研究,近年来,已经成为国外一些著名机构的研究热点。语音中的高层次信息往往是与文本内容有关的,因而如何从语音中提取出用于文本无关说话人识别的高层次信息特征便成为当前研究的重点。本文对韵律、发声特点等高层次特征信息的提取方法及其用于文本无关的说话人识别进行了深入研究。针对文本无关的说话人识别的特点,本文采用了概率统计模型的识别方法,将从与文本有关内容的语音韵律(X~t,X为语音特征)中的信息特征看作由韵律特征基元(称作超音段韵律信息特征)所组成的,通过对韵律特征基元分布的概率统计描述来实现说话人辨识。本文提出了一种基于多尺度小波分析从韵律中提取超音段韵律特征的方法,分别用于音源FO~t和声道MFCC~t的超音段韵律特征的提取。由描述缓变信息的概貌系数和描述快变信息的细节系数组成音源FO~t的六维超音段韵律特征参数PFO;而对于高维的声道MFCC~t,由于其各维参数的近似不相关和声道缓变的特点,从MFCC各维分别提取概貌系数组成声道超音段韵律特征参数PMFCC。在NIST 06 8side数据库上的实验表明,PFO与短时FO相比,系统EER相对降低了23.66%,PMFCC达到了与短时倒谱参数MFCC相当的性能。鉴于音源参数与声道参数的互补性,本文研究了音源超音段韵律参数PFO与声道超音段韵律参数PMFCC的组合参数PMFCCFO。PMFCCFO较MFCC在NIST06 8side数据库EER相对降低40%,在微软数据库的实验则表明了PMFCCFO有较好的噪声鲁棒性。采用PMFCCFO与短时参数MFCC的子系统输出评分线性加权后,可进一步提高系统的识别性能。NIST 08 3side评测任务中,采用了基于PMFCCFO的子系统与采用短时参数子系统的等权重输出评分加权,在电话语音条件下取得了最佳的DET曲线。本文还对从短时倒谱中间接提取发声位置特征用于文本无关说话人识别进行了研究,提出了一种基于特征空间映射的发声位置特征的提取方法,利用大量说话人的标准语音训练得到的MLP作为所有人共享的特征映射网络,提取出发声位置参数AF。AF参数反映了说话人的发声特点,与说话人发声器官物理属性和后天发声习惯相关,含有说话人信息,具有较好的噪声鲁棒性。与短时倒谱参数MFCC组成联合参数MFCCAF后,明显改善了说话人确认系统性能的性能与鲁棒性。
其他文献
目的:探讨亚临床甲状腺功能减低患者血脂、同型半胱氨酸及血尿酸水平变化及其可能原因。方法收集体检甲状腺功能正常患者(A组),甲减患者(B组)和亚临床甲状腺功能减低患者(C组)各35例,
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
会议
“能把你带到这儿来的东西,不能把你带到那儿去。”(What Got You Here Won’t Get You There)这是美国畅销书作家马歇尔·戈德史密斯一本书的标题。无论对企业还是对个人,这
目的:分析阑尾炎患者围手术期抗菌药物的用药状况,为围手术期抗菌药物合理应用提供参考。方法:回顾性分析阑尾切除手术住院患者病历68份,提取患者的一般情况、抗菌药物应用开始时
本文致力于二维空间谱估计和自适应波束形成技术研究,本文所作的工作是实验室承担的某重点预研项目的一部分。作为阵列信号处理的主要研究内容,波达方向(DOA)估计和波束形成(
目的通过检测多发性骨髓瘤(MM)患者外周血T、B淋巴细胞及调节性T细胞(Tregs)水平,评估MM患者免疫功能状态及与预后的关系。方法测定30例MM患者和20例健康志愿者外周血T、B淋巴细
“追求健康长寿”是现代人追求的理想目标。生物学指出:人的寿命最短100岁,最长150岁,公认寿命正常是120岁。美国调查显示:白人与黑人相比,物质生活好且地位高,患病少,寿命长。我国
目前,X线、CT、核磁能发现肺周围型肿块,但不能确定病理诊断。临床应用超声引导穿刺活检肺周围型肿块完成病理诊断逐渐广泛开展。我院自2003年3月-2008年10月对76例肺周围型肿
采用浸渍还原法制备了Pt/椰壳活性炭(AC)、Pt/Al2O3和Pt/Al2O3·TiO2催化剂,在常温、常压下考察了其对乙醇的催化活性。结果表明,3种Pt催化剂中Pt/AC对乙醇有着更好的催化活性。P
《概率论与数理统计》是经济管理专业开设的一门基础课程,本文分析了对于转型期的普通院校,经管类概率统计课程所面临的问题,并得出解决这一问题最好的途径是案例教学法。通