VQ和HMM在语音识别中的应用

来源 :东南大学 | 被引量 : 0次 | 上传用户:dingbinqi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
让计算机能听懂人类的语言,是人类自计算机诞生以来梦寐以求的追求。作为高科技应用领域的研究热点,语音识别(Speech Recognition)技术从理论的研究到产品的开发,是一项公认的极具挑战性和市场价值的工作,具有很强的理论研究意义和实际应用价值。本文研究了矢量量化(VQ)和隐马尔可夫模型(HMM)应用于语音识别技术的原理和方法。主要研究工作如下:1)探讨了语音识别的基本概念,分类和应用,并论述语音识别的发展和研究现状。2)从语音的发声原理开始,分析了语音参数对语音识别性能的影响,研究了基于VQ和HMM的语音识别系统的参数提取方法。3)探讨了矢量量化技术的原理,研究了矢量量化技术在语音识别中的应用。4)探讨了隐马尔可夫模型(HMM)的理论以及隐马尔可夫模型在语音识别中的应用,并详细介绍了利用HMM训练和识别的具体实现。5)通过研究,提出了矢量量化和隐马尔可夫模型相结合的VQ-HMM模型,并应用到数码语音识别中。
其他文献
随着移动通信技术的发展,宽带无线通信技术受到广泛的关注。由于正交频分复用(OFDM)技术具有高的抗干扰和抗多径衰落的能力,因此已经被公认为下一代无线通信系统中的核心技术。
盲源分离是指在源信号和其混合过程未知的情况下,仅利用观测信号来恢复或提取独立的各个源信号的方法。盲源分离作为数字信号处理领域一项新的技术,具有非常重要的理论意义和实
数字水印是信息隐藏技术的一个重要分支,自1993年出现以来,已经引起了人们极大的关注。它主要通过在媒体信息中嵌入标记信号(数字水印),为媒体信息在防伪、防篡改、认证、保
多媒体信息发布系统的诞生使人们能够更加直观高效地接受多媒体信息,也为商家带来巨大商机。该类系统现已被应用于很多的公共场合,例如宾馆、商场、车站、小区等。本文应山西
针对声音目标探测的应用,本文设计并实现了一种以ATmega128L为核心,结合射频芯片CC1000的低功耗、小体积声目标探测无线传感器网络节点。论文详细地阐述了节点的各个功能模块
在产业全球化分工和市场竞争日益激烈的商业环境下,许多独立企业自发地结盟形成供应链。为了提高整个供应链的效率,处于供应链中不同角色的企业都在致力于建立统一的电子商务
在源信号和传输信道未知的情况下,仅利用传感器接收的观测数据恢复出源信号,称为盲源分离。因其在天线阵列信号处理、多用户通信、语音和医学信号处理等领域具有广阔的应用前
本论文以嵌入式Linux系统中的BSP技术为研究内容。首先,论文介绍了嵌入式Linux系统BSP的基本概念,然后就启动引导程序和设备驱动的基本功能、实现技术、编程接口等进行讨论。
期刊
图像分割是图像处理的一项基本操作,是图像工程的一个重要内容,所有与机器视觉有关的领域都要用到图像分割。总结现有的图像分割算法,可以发现,大多数算法都是基于图像的底层特征