语音识别算法在ARM-linux平台上的研究与实现

来源 :河北科技大学 | 被引量 : 4次 | 上传用户:fuyw118
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着电子技术和移动互联网的飞速发展,移动终端变得越来越贴近人们的日常生活,更自然的人机交互方式显得更加重要。语音识别作为一个更自由和方便的人机交互的方式,走入人们的生活。而且随着移动终端的普及,ARM平台成为现在硬件平台的热点,所以研究语音识别在ARM-Linux平台上的实现,成为一个交叉的热点。论文模拟了日常家居家电控制的一套语音控制系统,目的在于在ARM-Linux平台上实现一个小词汇量的连续的非特定人的语音识别系统。论文首先深入的研究了语音识别的基本思想和基本流程,然后分阶段研究了语音识别的前处理算法、两种特征提取算法和三种比较重要的识别算法,其中重点研究和应用了隐形马尔可夫模型(HMM),并深入研究了HMM的三个基本算法:前向后向算法、Viterbi算法、Baum-Welch算法。论文在选定了HMM作为实现算法之后,具体设计了系统的软件模块流程。结合剑桥大学开发的HTK工具包进行了对语音样本的HMM模型训练,并将训练出的模板运用语音识别引擎进行识别。然后将语音识别模块进行交叉编译,并植入ARM-Linux平台,建立一个基于ARM-linux平台的语音识别系统。论文为HMM在嵌入式中的应用做了基础性的探索,使语音识别进入日常生活的应用又迈进了一步。
其他文献
2006年Google首席执行官Eric Schmidt首次提出了“云计算”的概念,现在它已成为国际IT业中的重要增长点。云计算时代的到来,使得各种类型的互联网应用层出不穷,各类数据呈爆炸式
多输入多输出(Multiple Input Multiple Output,MIMO)与正交频分复用(Orthogonal Frequency Division Multiplexing,OFDM)结合的MIMO-OFDM技术已成为新一代宽带无线移动通信网
双目视觉技术是计算机视觉技术的一个重要分支,它模仿人类双眼获取环境信息的原理,利用两台摄像机从不同位置拍摄同一物体,然后获取二维数字图像,并利用几何原理对采集到的图像进
人脑是由数以亿计的神经元及各神经元之间耦合而成的一个复杂的非线性动力学系统。将复杂网络理论的方法应用于脑神经科学领域,运用系统的观点分析大脑神经元之间的信息处理
LTE-Advanced系统于2010年10月正式被国际电信联盟(ITU)接纳为第四代移动通信国际标准,成为IMT-A (4G)的主要技术之一。该系统以正交频分复用和多输入多输出技术为基础,综合
随着人们对于供暖的需求不断加大,传统的按供热面积收费方式不合理,这一问题日益凸现,而人工抄表方式效率低下,因此热量表远程抄表的出现就显得尤为重要。  在热量表远程抄表系
在广播电视数字化进程迅速发展的当今社会,随着广告业繁荣发展,广告监测行业已经成为研究的热点。而利用计算机对广播电视进行监测是有效的手段。   针对广告监播的特点和要
旋转机械是工业部门中应用最为广泛的一类机械设备,其核心部件为转子-轴承系统。利用振动信号对转子-轴承系统的运行进行实时监测、分析与诊断,是保证旋转机械稳定、高效运作的重要措施。但随着旋转机械设备结构的大型化和工作环境的复杂化,传统的故障诊断方法已不能满足现代转子系统故障分类的需求,故智能故障分类方法在转子故障诊断研究中占有愈加重要的地位。然而,现有的智能故障分类方法很难解决通用性与高效性之间的矛盾
随着计算机辅助设计(CAD)、计算机辅助制造(CAM)及地理规划设计等的发展,二维矢量图形因其精度高、缩放无失真、易于存储和便于操作等优点在建筑、机械及地理信息等行业中得
  随着电信技术的快速发展,频谱资源匮乏的问题日益显现出来。传统的无线网络普遍采用固定式的频谱分配方案,导致很多授权频谱利用率低下,从而加剧了频谱资源不足和用户需求之