汉语连续数字语音识别的研究

被引量 : 0次 | 上传用户:xujc8639
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,语音识别技术取得了突破性的进展,开始由实验室走向人们的日常生活中。语音拨号、语音上网等人机语音交互手段正在被越来越多的人认识和运用,语音识别展现了巨大的市场价值和广泛的应用前景。本文针对“0”到“9”十个阿拉伯数字的汉语发音,在总结前人研究成果的基础上,为提高系统的识别性能,实现了一个汉语连续数字语音识别系统。本文首先分析了语音识别技术的发展现状及未来的发展趋势,揭示了语音识别现阶段存在的难题及拟解决的办法。在此基础上,阐述了语音识别的原理,重点介绍了语音信号产生的声学模型。在语音信号端点检测部分,提出了改进的基于MFCC相似度(MFCCS)的端点检测算法,有效地提高了系统的抗噪声能力,并给出了实验仿真结果和分析,实验证明,该算法在低信噪比下能够得到良好的端点检测效果。在语音信号的特征参数提取部分,详细介绍了线性预测倒谱参数(LPCC)和Mel频率倒谱参数(MFCC)的提取过程。提出将短时能量和MFCC加权混合形成新的特征参数EMFCC,并以此作为语音训练和识别的特征参数。实验表明,EMFCC比MFCC具有更好的系统识别性能。随后对隐马尔可夫模型(HMM)及其在语音识别中的应用进行了深入的研究。对HMM需要解决的评估问题、解码问题以及参数优化问题进行了详细分析,并介绍了解决问题用到的前向后向算法、Viterbi算法和Baum-Welch重估算法。最后,给出MATLAB平台上的实验仿真结果和分析,包括语音信号的预处理、连续语音端点检测、特征参数提取、HMM训练和识别。
其他文献
稀土离子掺杂发光玻璃在激光、光学放大器、光通讯、储能和显示等光电领域有着广泛的应用。氧氟玻璃既具有氧化物玻璃的高机械强度、高化学稳定性和热稳定性等特点,又具有氟
ZnO作为II-VI族直接宽禁带半导体材料,在室温下的禁带宽度约为3.37eV,对应紫外波段的光子能量,且ZnO具有较高的化学和热稳定性,较强的抗辐射损伤能力,来源丰富,电子诱生缺陷较低等
<正>《讲话》版本变迁的历史,是一部《讲话》的接受史。《讲话》版本研究,对于历史地认识这部著作的思想意义和文学史价值,有着显而易见的意义。本文拟对《讲话》1943年6月本
体力活动水平与健康之间存在着剂量反应,如何准确测量体力活动水平是研究人员关心的问题。本文总结分析了行为观察法、双标水法、体力活动问卷、心率、运动传感器等体力活动
本文运用文献资料法和逻辑分析法对社区体育发展应注意的几个问题进行了分析与研究,它们是自觉性问题、计划性问题、全面性问题、经常性问题、适量性问题、针对性问题、娱乐性
<正> 在中国现代文学史上,三十年代的文学以一种全面繁荣的姿态令人不容忽视,主要表现为对文学艺术性的追求,各种艺术表现手法在不同领域中的运用,并且留下了一大批优秀的文
<正>1930年代文艺大众化运动,"差不多和普洛文学运动是同时发生"~①,并贯穿于整个左联时期。它是左翼文艺界组织的一个重要的文艺运动,也是丁玲走向"革命"后所参加的第一个重
用湿帘冷风机、高密聚酯布及PVC定向风管组成的湿帘自动降温系统在炎热的夏季对分娩舍里的母猪及小猪能起到有效的、有针对性的自动降温作用。
炮管同步精度是影响火炮射击精度的一项重要指标,炮管同步精度误差是现代火炮出厂检验、日常维护等必须记录的重要参数。随着现代科技和军事技术的发展,传统的炮管同步精度误