基于小词汇量孤立词语音识别系统的研究与设计

来源 :长安大学 | 被引量 : 0次 | 上传用户:xiaxia904
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音识别以语音信号为研究对象,是语音信号处理的一个重要研究方向,是模式识别的一个重要分支。随着现代计算机技术的发展,计算机的使用越来越深入到人们的日常生活中。人类与计算机进行交流时,最直接和方便的方式就是语言交流,所以语音识别已成为现代计算机技术研究和发展的重要领域之一。本文对语音识别系统进行了概要的阐述,并提出了一种小词汇量孤立词语音识别系统的实现方法。论文首先对语音识别系统中涉及到的基本概念及原理进行了简单的分析,之后分别针对语音识别系统中预处理阶段的端点检测算法、语音信号的特征提取算法以及模式匹配和模型训练算法进行了深入的理论研究。采用“双门限”法实现语音端点检测,在实验室环境下取得了较为理想的检测效果;系统地研究了语音识别系统各种主要特征参数的提取方法,特别分析和研究了线性预测分析系数(LPC)和美尔频率倒谱系数(MFCC)的提取方法;针对模式匹配和模型训练问题,本文采用了基于连续概率密度隐马尔可夫模型(CDHMM)的语音识别模型。实验证明,在信噪比较低的实验室环境下,该模型取得了良好的识别结果。
其他文献
随着Internet和数字音频编码技术的快速发展,数字音频的传输和获取越来越便利,极大丰富了人们的日常生活。但是,伴随而来的盗版现象也愈加猖獗,数字音频文件的版权保护变得越来越
入侵检测系统(Intrusion Detection System, IDS)对网络传输进行即时监视,并对其中可疑传输发出警报。然而,在计算机网络攻击手段的日益复杂、大规模协同攻击层出不穷的形势下,IDS
提高高职院校科研项目管理的效率和质量己成为各大院校科研工作改革的当务之急。论文以滨州职业学院科研处实际情况为背景,应用了现代计算机和数据库技术,严格按照软件工程的方
SAR图像分割是SAR图像处理与解译中基本而关键的技术之一,分割结果对图像后续处理有重要影响。SAR图像因其独特的成像机制造成地物聚集区域在SAR图像呈现有统计规律的明暗灰度
随着多媒体技术的成熟、网络的发展和信息处理能力的加强,多媒体数据库的发展与完善日益成为一个迫切的需求。由于媒体数据具有数据量大、种类繁多、数据结构和格式多样化的特
数字视频监控以其直观、方便、信息多样,广泛应用于多种场合。嵌入式网络摄像机是视频监控系统的主要组成部分。系统的软硬件平台与其相关应用软件的设计,是嵌入式网络摄像机系
软件度量和估算能够有效的监控软件进度。在常用软件度量方法中,对规模的度量和估算是所有度量活动的基础,其结果可作为其它度量的一个主要输入,因此在软件度量活动中具有重要地
Web服务具有良好的封装性、松散耦合性、高度可集成能力等特点,能够解决工作流程管理中各应用单元分散、需集成的应用软件平台不统一等方面的问题,但Web服务不能很好地解决有关
H.264/AVC是由ITU-T的视频编码专家组(VCEG)及ISO/IEC的活动图像专家组(MPEG)共同研究、适应于低码率传输的新一代视频编码标准。它具有高压缩比、高图像质量和强抗误码性等
云计算通过云服务代理完成与用户之间的交易,在云环境下,一切皆为服务。作为21世纪又一代技术革新产物,云计算充分应用互联网平台,将虚拟化的云资源按照用户需要提供给用户,并在交