【摘 要】
:
声音是人与人之间进行交流的信息载体,声音在人机交互中也起到了举足轻重的作用。声纹识别是语音识别中一个十分重要的方向,这种技术应用到人机交互中就会大大提高人机语音交互的安全性。作为一种生物认证识别方式,声纹识别还有很多重要的应用前景。近些年来,机器学习技术在自动语音识别领域取得了重大的突破,越来越多的机器学习方法尤其是深度学习方法被引入到声纹识别中,并取得了显著的成效。基于i-vector的声纹识别
论文部分内容阅读
声音是人与人之间进行交流的信息载体,声音在人机交互中也起到了举足轻重的作用。声纹识别是语音识别中一个十分重要的方向,这种技术应用到人机交互中就会大大提高人机语音交互的安全性。作为一种生物认证识别方式,声纹识别还有很多重要的应用前景。近些年来,机器学习技术在自动语音识别领域取得了重大的突破,越来越多的机器学习方法尤其是深度学习方法被引入到声纹识别中,并取得了显著的成效。基于i-vector的声纹识别方法是目前与文本不相关声纹识别的基准方法。但这种方法面对短时语音时的识别率较低,也容易受到噪声干扰。本文利用机器学习的理论设计了基于时延神经网络的声纹识别方法,相比于基准方法,这种方法提高了声纹系统的识别率和稳定性,尤其是在短时声音的识别效果方面,应对噪声的鲁棒性也更强。为了进一步提高系统的识别效果,本文又设计了基于生成向量的声纹识别方法,这种方法将基于i-vector的声纹识别方法与基于时延神经网络的声纹识别方法进行了“融合”。此方法利用典型关联分析,将部分i-vector的信息融合到时延神经网络提取的特征向量中,使得生成向量更能表征说话者的身份特征。对三种声纹识别方法进行了实验验证,比如在VoxCeleb语音库下模型的识别效果上生成式特征向量模型的等错误率EER比传统的i-vector模型降低了3.1%。生成式特征向量模型比传统的i-vector声纹识别模型应对噪声的鲁棒性更强。本文还对设计的模型进行了实际的应用测试,验证了系统在应用的可行性。
其他文献
膜污染问题一直是限制PVDF超滤膜在污水再生领域广泛应用的关键因素,探明PVDF超滤膜污染的本质原因,对超滤膜抗污染改性研究有重要的意义。基于城市污水在解决未来水资源短缺
一、组蛋白乙酰转移酶2A(KAT2A)在儿童急性白血病中的作用机制研究目的:以“组蛋白密码”学说为核心的组蛋白调控、组蛋白修饰等均是当前肿瘤研究的新热点。KAT2A是我们以该
水滑石是一种具有层状结构的阴离子型化合物,因其具有碱性、层间离子可交换性和结构记忆性而被广泛用作催化剂、吸附剂、PVC阻燃剂和热稳定剂等。本文采用共沉淀法制备镁铝二
改革开放以来,中国社会发生了巨大的进步,不仅各项制度不断完善、各个产业也不断发展壮大。其中,作为金融行业支柱之一的保险业,也与银行业和证券业一样正在以惊人的速度发展
本文是一篇英译汉翻译实践报告,所译原文选自《美国州立大学金融教育课程体系的构建与实施》这本著作的前两个章节。该书主要采用案例分析法,通过详细分析四种课程模式的实施
目的评估四川省各县(市区)实现持续消除碘缺乏病目标的情况方法抽查21个市、州通过了县级自评,市级复核后申请达标的县由省级抽查县通过资料审核和现场评价进行考评结果抽查4
细胞极性是真核生物的基本特征。一些蛋白的极性分布对于发育过程中的非对称性分裂,神经细胞轴突的形成和上皮细胞紧密连接的建立是必需的。Par-3通过和其它家族成员如Par-6/
针对煤炭上市公司作为环境重污染监控对象而其环境会计信息披露不尽如人意的现象,结合国家发布相关环境保护和环境信息披露的法规和政策规定,选取25家煤炭上市公司为分析对象
高校作为教育最为重要的一个场所,其学术氛围、研究成果、科研专家等都是衡量一所高校文化水平的基本标准。智库同样是评估高校文化教育水平的标准之一。因此我国高校应当依
通过对国内外研究现状和研究成果的分析和总结,介绍常用的鲜切果蔬保鲜方法,可食涂膜的种类、特点及应用,概括了可食涂膜在包装鲜切果蔬上的研究进展,为进一步开发可食涂膜材