基于Kaldi的语音识别的研究

来源 :南京邮电大学 | 被引量 : 0次 | 上传用户:yigenjin2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着人工智能技术的快速发展,传统人机交互手段的弊端逐渐暴露,人们对新交互产品的需求越发迫切。与此同时,大数据、涟漪效应和深度神经网络的发展带来了语音技术的大爆发,语音技术也进入了新纪元。将语音技术应用在交互手段中,开发语音交互系统成为新的研究热门。Kaldi是一个使用C++编写的全面向对象的工具包,由前微软公司研究院的Dan Povey博士与捷克的BUT大学联合开发。它功能强大,支持现阶段绝大部分主流模型、算法和数据,它开源的特性,方便我们第一时间获得新技术、新理念、新思路,它多平台兼容的特性很适合开发工作。本文研究了混合高斯隐马模型、神经网络隐马模型的建模、训练和解码,对模型中运用的算法、数据处理方式、进程加速技巧进行了深入分析;深入研究了Kaldi的源码,解析了其内部功能和实现机理,对基于Kaldi搭建的混合高斯隐马模型和神经网络进行了性能测试和对比,认识到神经网络隐马模型相对于混合高斯隐马模型的优越性,同时也认识到了其不足。针对神经网络训练中经常出现的由训练过拟合导致的训练时间过长问题,本文提出了一种新的函数作为激活函数,并利用Kaldi进行实验。实验证明该函数在解决梯度弥散问题上,取得了有效的成绩,训练时间得到了一定程度的降低。相信如果对该函数进行进一步研究和优化,可以降低神经网络训练对硬件的要求,推动神经网络技术的进一步发展。
其他文献
目的了解我院金黄色葡萄球菌的临床分布、耐药性变迁及agr基因分型。方法我院临床分离的耐甲氧西林金黄色葡萄球菌,采用微量肉汤法进行药敏试验和结果判断;采用多重PCR法进行
随着我国资本市场的发展,盈余管理在我国会计理论界具有越来越重要的研究价值。目前,我国的物流行业由于其特定的服务对象和复杂的资本结构,物流上市公司也存在过度的盈余管
<正> 在中国史学上、史家作为社会一员而与社会的关系、史学作为历史进程的反映而与客观历史的关系,是十分密切的,也是很复杂的.我们甚至可以用这样的话来说明这两个问题的重
目的:探讨早期泌尿系感染T淋巴细胞亚群改变以帮助临床的早期诊断和治疗。方法:研究纳入2016年3~12月我院收治97例患者以及健康体检者26例,通过对各组外周血白细胞、中段尿白
通过露头实测、岩心观察及测录井资料分析等结果表明,克拉玛依油田一中区克拉玛依组S7、S5和S4砂层组沉积时期以发育辫状河为特征,可进一步划分为近源砾质辫状河、远源砾质辫
<正> 死后葬于西子湖畔的曼殊和尚,是清末民初的一代才人。 苏曼殊(1884—1918)原名戬,字子谷,后更名玄瑛,曼殊是他剃度为僧时自取的法号。原籍广东香山县(今中山县),出身于
期刊
汽车作为消费产品,质量是决定其成功与否的关键。顾客对于汽车质量的认知过程是由对主观质量的感知开始的。为了保证生产过程能够如实地将设计意图转化为产品主观质量属性以
高中是每一名学生重要的转折阶段,做好高中政治课堂教学X-作十分重要,一方面政治是高中重要学科之一,其教学质量的好坏直接影响学生高考成绩;另一方面,高中政治教育在引导学生树立
由于在传统教学中,教师习惯刻意执行预设教案,讲求结构严谨、层次分明的教学方式,束缚了学生思维与创造能力,所以,师生对如何围绕教学内容,共同参与,通过对话、沟通和合作活动,产生交
<正> 我厂目前生产的产品向着大型和重型发展,其导轨长度超出母机加工长度。显然要加工超长度的床身导轨在没有大机床的情况下,只能发扬蚂蚁啃骨头的精神,用短机床加工长床身