小词汇非特定人的孤立词语音识别系统的研究与设计

被引量 : 6次 | 上传用户:reg8c4user
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音识别技术是语音信号处理中的一个分支,语音识别技术就是让机器通过识别和理解过程把语音信号转变为相应的文本或命令的技术。语音识别是一门交叉学科,涉及到人工智能、模式识别、数字信号处理、计算机科学、语言声学、心理学、生理学和认知科学等许多学科领域,具有深远的研究价值。语音识别和语音合成技术已经成为现代技术发展的一个标志,也是现代计算机技术研究和发展的一个重要领域。虽然语音识别技术已经取得了一些成就,也有部分产品面世,但是,大多数语音识别系统仍局限于实验室,远没有达到实用化要求。目前语音识别技术研究的热点是如何实现在线无监督的学习和多方法综合自适应学习算法;制约实用化的根本原因可以归为两类,识别精度和系统复杂度。语音识别按照任务的不同可以分为四个方面:说话人识别、关键词检出、语言辨识和连续语音识别。本文主要对小词汇非特定人的孤立词语音识别算法进行研究。语音识别的主要流程包括:语音信号的预处理、端点检测、特征提取、建立语音模板库、模式匹配。本文首先探讨了语音识别的基本原理和各种语音识别算法的特点,比较并选取了有效的非特定人孤立词语音识别算法,对其实现进行了深入分析,最后利用VC进行了开发。采用动态时间归整模型形成的经典语音识别算法常用在非特定人小词汇量语音识别系统中,本文提出了具有一定鲁棒性的端点检测语音识别技术,对传统的基于过零率与短时能量的双门限端点检测方法进行了改进,提出了根据语音文件数据自动调节门限的可变门限端点检测方法,并对该算法在Matlab进行仿真测试,试验表明该算法对语音端点检测的准确度有一定的改善,然后本文使用VC对该算法的进行了编程实现。在语音信号采集时,通过调用底层API,在一定程度上减小了噪声对语音数据的影响。论文对语音波形的特征提取线性预测倒谱系数(LPCC),利用动态时间规整技术(DTW)对模板进行匹配和聚类的方法建立模板库。最后,论文对算法的实验结果进行了测试分析。
其他文献
本文以叙述学、文体学和巴赫金历史文化诗学、狂欢诗学、弗莱“叙述结构循环论”为基本理论框架,结合文化批评、社会历史批评、文学史研究等方法,文本细读和流派概括相结合,
成釉细胞瘤(ameloblastoma, AM)是口腔颌面部最常见的牙源性肿瘤,占牙源性肿瘤的59.3%。AM虽为良性肿瘤,但具有局部侵袭性,肿瘤细胞常向骨小梁间侵润,临床治疗容易复发,其复
权力腐败是我国当今社会普遍存在的社会现象。十八世纪法国启蒙运动思想家孟德斯鸠曾说过:“一切有权力的人都容易滥用权力,这是万古不易的一条经验。”英国著名的阿克顿勋爵
托马斯·杰斐逊是美国历史上著名的政治家和哲学家。他开创了美国自由和民主思想的先河,缔造了美国民主共和制度,并将其运用于政治实践,形成了美国独具特色的民主政治文化,时至今
沈德潜的《唐诗别裁集》是中国诗学史上一部极负盛名的经典唐诗选本,其取材全面、选目精当、选量适中、体格严密,且有简明而切中肯綮的评语,因而至今流传甚广,影响较大。此书共选
发酵乳的功能特性主要是由于乳酸菌作用的结果,从自然环境,特别是从具有悠久历史的传统发酵乳制品中分离、筛选出优良乳酸菌种,受到了国内外研究者的广泛重视。甘肃甘孜地区具有
事业单位是我国建国后一直沿用的一种提供公共服务的基本组织形式。自上世纪80年代中期以来,我国政府始终没有停止过对事业单位管理改革的步伐,但由于改革的目标模式不够清晰
为落实党的十七大提出的提高财政资金开发水平,逐步提高财政开发资金标准的政策,国家财政对农业综合开发资金的投入逐年增加,但这方面的理论研究明显滞后,特别是缺乏对农业综
软件需求在整个开发环节中的地位是至关重要的,目的是通过与用户广泛地交流确定应用系统的目标,如果这一部分的工作出错,将导致整个项目的成本成倍地增加,交付时间延长,降低
腐蚀作为材料破坏的主要形式之一,对国民经济和国防建设中的各个部门造成巨大的损失。如果利用现有的防腐蚀技术对材料进行合理的防护,可减少约三分之一的损失。而有效的防腐蚀