基于因子分析的与文本无关的说话人辨认方法研究

被引量 : 0次 | 上传用户:loveaudio
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
与文本无关的说话人辨认旨在通过说话人的语音而非语义信息从而辨认出话者的身份,该研究在充分利用语音识别的非接触性的基础上逐渐发展成为生物认证领域的关键技术。近年来伴随着日益复杂的网络环境以及语音传输信道的多样化,传统的说话人辨认方法已经无法适应实际的应用环境,因此说话人辨认的鲁棒性研究[1]成为当今说话人识别领域的热点。因子分析的方法实质上是对说话人的语音提取紧凑的能够代表说话人身份的特征矢量,被称为I向量或者总体变化因子。I向量是基于联合因子分析(JFA)[2]的方法在2010年由Dehak提出的,相比联合因子分析的方法,它只需训练出一个全局变化空间,从而每个说话人的语音特征就可以利用该空间的I向量来表示。实验表明因子分析的方法能够有效地解决训练与测试环境不匹配的问题。获取I向量首先要对每个说话人建模,文中采用LBG算法和模糊理论相结合的方法来初始化模型。由于I向量既包含说话人的特征又包含信道信息,因此对I向量进行信道补偿是必不可少的,目的是实现信道信息与说话人特征的分离。信道补偿技术包括线性区分性分析(LDA),主成分分析(PCA),类内协方差规整(WCCN),干扰属性映射(NAP)。实验中比较了不同信道补偿技术的识别性能,并且在识别过程中采用多种不同的方法包括矢量量化,对数似然度,支持向量机和余弦距离测度进行对比。结果表明信道补偿技术将LDA与WCCN方法结合,模式匹配模块采用余弦距离测度配合得分规整的系统能够达到较佳的正确识别率。最后论文对识别系统的训练和测试过程的图形用户界面进行设计与仿真。
其他文献
2018年2月5日,由中国计算机学会计算机安全专业委员会和新华社《经济参考报》"互联网+周刊"联合主办的"2017年中国网络安全大事"发布会在公安部第一研究所召开。此次会议发布了结
近年来社会责任缺失引发的恶性事件层出不穷,特别是食品饮料安全问题,如百事可乐染色剂焦糖色素、酒鬼酒事件、立顿茶叶事件、问题奶粉等重大食品事件受到了人们的广泛关注。
中国古代的"乐律",最早称"音律",其后亦有"钟律"、"律吕"、"乐典"、"声律"等基本意义相通的称谓。之后又出现了"乐学"、"律学"的学科名称。进入现代社会后又出现了"乐律学"的
当代,计算机网络技术快速发展,无线网络已经进入了千家万户。笔记本电脑、手机、电视等一些智能化产品已经连入家庭Wi Fi网络,人们都在远端就能进行操控。大家在计算机无线网
<正>春节长假,正好有空闲的时间待在家里,于是挑出一些个人认为比较心仪的历史珍藏录音唱片与大家一同分享一下我的精神食粮。萨佩尔尼科夫(Sapelnikoff 1868—1941),俄罗斯
目的 Sry相关的HMG盒基因2[Sry-related(high mobility group,HMG)Box Gene 2,Sox2]蛋白在多个肿瘤的发生发展过程中具有重要作用。本研究旨在探讨Sox2对人非小细胞肺癌(non-
动漫产业作为文化产业中新兴的一支,被誉为"21世纪知识经济的核心产业"。随着人们对动漫观念的改变,动漫产业发展日益受到世界各国以及我国各大城市的普遍重视。近年来我国动
2015年中国股市经历了暴涨暴跌的行情,从2000点附近一路飙升到5178点,投资者在喜悦氛围中陷入了投资狂热的状态。随后行情急转直下,上证指数又从5178点迅速下跌到2638点。由
进入21世纪以来,由于经济全球化带来的影响,人们对所用产品安全性的要求也越来越高,人们要求所用产品具有更好的持久性和更高的可靠性。因此,针对人们日益增长的物质文化需求
巴基斯坦基于自身利益,为加强与南盟成员国的贸易、与各成员国合作解决共同面临的困难与挑战,在南盟中积极作为,通过举办各种会议、提出多项建议、支持在其境内设立地区中心