【摘 要】
:
虽然非特定人语音识别系统达到了令人满意的性能,但在实际应用时,由于说话人的改变通常会使系统性能显著下降。当遇到特殊口音的说话人时,系统的误识率甚至更大。语音识别要
论文部分内容阅读
虽然非特定人语音识别系统达到了令人满意的性能,但在实际应用时,由于说话人的改变通常会使系统性能显著下降。当遇到特殊口音的说话人时,系统的误识率甚至更大。语音识别要走向实用,就必须克服这个鲁棒性问题。因此,说话人自适应技术的意义非常重要。本文从说话人自适应技术入手讨论了语音自适应的各种方法。通过对说话人引起的声学差异的讨论,我们分析和实现了两种说话人自适应方法:最大后验概率(Maximum a Posteriori, MAP)方法和特征语音(Eigenvoice, EV)方法。实验证明这两种自适应方法对说话人自适应有很好的效果。在此基础上本文提出了一种适合强健语音的综合自适应方法。它是在MAP方法中引入一个EV模块,这种新方法成功地结合了MAP和EV两种方法的优点,弥补它们的的缺点。EV方法(属于快速说话人自适应方法)在自适应数据很少时性能优于MAP方法,但随着数据的增加,由于很强的约束强加于它的模型假设,其性能难于改善;而MAP方法给出了结合先验知识和自适应数据的最优解,有良好的渐进性,但自适应数据较少时性能较差。最后,本文通过对汉语数字的识别实验实现了这三种说话人自适应技术。从识别实验中可以看出,在自适应数据较少时,EV方法识别效果较好,而随着自适应数据的增加,MAP方法显示了其优越性。而我们提出的结合这两种方法的综合自适应方法,即使在自适应数据比较少的情况下也取得了很好的效果,这种新方法能够有效的克服说话人差异对识别系统的影响,适合强健语音识别系统的要求。
其他文献
新媒体发展使得少数民族地区各类传统媒体受到极大冲击,同时也使电视新闻获得更大空间,使电视新闻以其为平台发展地更为灵活与高效。少数民族地区由于地理位置等的制约,使新
空中连廊作为建筑之间重要的连接性要素,充分显露了结构技术对其自身真实性表达的重要性,并最终反映到建筑的整体形象当中。论文以结构技术为关注点,研究空中连廊力与形的关
字母是构成英语的最小单位,在小学英语起始阶段,优化英语字母教学十分重要。英语字母教学要改变独立化的教学模式,要善于借助图形、游戏、音乐凸显其形象化、趣味化和韵律化
近年来,沭阳农商银行党委深入贯彻落实党的十九大精神和各级党委安排部署,聚焦坚持党的领导、加强党的建设、全面从严治党的要求,充分发挥党组织的战斗堡垒作用和党员先锋模范作
房地产行业在一个国家经济社会发挥过程中发挥不可或缺的作用,我国房地产行业发展过程中存在房价过快上涨、供需不平衡等问题,需要通过制定相应的财政税收政策、土地供应政策
新媒体技术的发展是把双刃剑,虽然其对主流媒体造成了一定的冲击,但也给少数民族地区的新闻报道带来了福音。因此,我们要充分利用新媒体的优势,增强新闻报道能力,更好地满足
斜纹夜蛾(Spodoptera litura Fabricius)是一种重要的多食性害虫,生产上主要依靠化学防治。近些年来,该虫在我国许多地区频繁暴发,而且绝大多数常规药剂已不能有效控制其危害,因
随着水利信息化进程的快速发展,与水利信息相关的互联网资源不断增多,面对如此巨量和复杂形式的水利信息数据,依靠人工检索、分析的方式已难以满足行业应用的需求。随着大数据信
适当的住房,是人类生存和发展所不可缺少的重要物质条件,因此,以“人人享有适当的住房”为内容的住宅权是公民的一项基本权利。尊重、保护、实现公民的住宅权,是国家义不容辞的责
航天某重大工程是通过关键技术攻关与飞行试验演示验证的国家重大科技工程,采用飞行试验方法来考核理论与设计方法的正确性,验证关键技术的可行性,其飞行试验项目由于每发验