基于神经网络/HMM的语音识别算法的研究

来源 :武汉理工大学 | 被引量 : 0次 | 上传用户:beret85
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机技术的飞速发展,电脑已经走入千家万户,给人类带来了无穷的便捷。与此同时,信息时代的到来使人们对计算机的智能化要求也越来越高,这也体现在人机接口上。人机对话让“机器”听懂人的语言越来越被人关注,语音识别技术正是实现这一功能,在现实生活中很多行业都采用语音识别技术进行智能化管理等,故语音识别和语音合成也成为现代计算机技术研究和发展的重要领域之一。 语音识别技术与多种学科的研究领域都有联系,这些领域的科研成果也成为推进语音识别技术发展的重要因素。语音识别技术已经取得了一些成就,但是,由于语音信号的多样性和复杂性,目前的语音识别效率也不是很高。因而发展高效率识别语音模型和算法成为语音识别研究中的一个重要课题。 本文首先对语音信号的预处理和特征提取问题进行了讨论,提取了三个有效的语音识别特征参数——LPC系数、LPC倒谱系数和Mel频率倒谱系数(MFCC);其次着重讨论了语音识别中常用的三种识别方法——基于模板匹配的矢量量化(VQ)、神经网络和隐马尔可夫模型在语音识别中的应用,分别讨论了各自的模型训练和识别的算法,对HMM算法作了详细地论述;然后结合神经网络和HMM提出的改进方法即基于统计的神经网络/HMM的语音识别模型和算法;最后通过实验仿真比较参数、算法不同对识别孤立语音的效果和两者在识别连续语音的效果进行讨论。得知采用MFCC作为特征参数比LPCC作为特征参数识别率要高,在孤立语音识别时,利用VQ模型算法比利用PNN/HMM算法识别率高得多,但在连续语音识别时,后者则比前者识别率要高。
其他文献
诉讼时效的适用范围问题在我国民法学界一直存在争议。现有的观点主要是对具体的民事权利是否适用诉讼时效作个别的讨论,但是应当采取何种标准来判断民事权利是否适用诉讼时
近十年来经济全球化的快速发展直接促进世界资本市场一体化的形成,在此过程中,作为全球通用的商业语言的会计信息,其质量的高低直接影响全球范围内资本流动的深度与广度,进而
中国城市无车日活动自2007年开展以来,得到各级政府、企事业单位、媒体、社会团体与市民的广泛响应。截至2015年9月,承诺开展活动的城市达到183个,涉及2亿以上城区人口,超过5
基于我国1 2省(市)2003-201 2年面板数据,采用面板固定效应模型和面板门槛模型考察了医疗保险对不同收入人群医疗费用的影响差异性,研究结果表明:医疗保险整体上对医疗费用具
在诉讼活动中涉及到会计问题不是近年才有的事情,但是因为过去经济主体之间的经济活动较为简单,纠纷发生后也较易解决,影响范围小,并未引起人们尤其是会计界人士的特别关注。
民办院校是当今教育形势下我国高等教育办学模式与体制的探索与革新之举,而民办院校的辅导员则肩负着当代大学生思想政治教育的重任,也是为大学生引航的最好向导。近年来,民办院校辅导员队伍管理体系呈现出了诸多问题,由此致使辅导员流失的问题日益显著,对民办院校未来的稳定性发展也产生了一定的影响。因此,民办院校辅导员流失问题的深入研究,将为民办院校规划人力资源提供更明确的方向,使辅导员队伍体系更加稳健,也将有助
目的建立不同商品来源的草豆蔻挥发油和黄酮类成分高效薄层色谱指纹图谱,为其质量控制提供依据,并以草豆蔻为对照,对其近缘种常用药用植物进行考察。方法应用硅胶GF254高效预
目的探讨抗桥粒芯蛋白Dsg1、Dsg3抗体水平在天疱疮诊断和病情评估中的应用价值。方法选择经组织病理及直接免疫荧光法检查确诊的63例天疱疮患者(试验组)及同期40例排除大疱性
胃癌是最常见的癌症之一,其发病率在我国居第二位。胃癌的发生是多因素共同作用的结果,而幽门螺杆菌是WHO认定的胃癌的首要致癌因子。本文归纳了幽门螺杆菌菌株特异性与胃癌
今年是我国加入世界贸易组织过渡期的最后一年,这意味着我国还有不到一年的时间就要兑现对外资金融机构全面开放的承诺,外资金融机构类似“金融百货公司”的综合化经营给中资