汉语孤立字语音识别技术的研究

来源 :西南交通大学 | 被引量 : 0次 | 上传用户:xielinyun
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人类有个理想,让机器具有“听”、“说”人类语言的能力。这个理想,在信息时代正逐步变成现实。语音识别正是解决机器“听”懂人类语言的一项研究。孤立词语音识别实现简单、技术成熟,有着广泛的应用前景,是深入研究语音识别的基础。本文对小词汇量、非特定人的汉语孤立词的语音识别技术进行了分析和研究。首先介绍了语音识别系统的组成和识别原理,并对语音信号的预处理过程、端点检测常用的特征参数以及语音识别的方法作了分析,重点讨论了MFCC特征参数的提取。继而重点研究了孤立词的端点检测算法,并在基于信息熵、子带谱熵和频带方差的端点检测算法的基础上,对原有算法做了修正和改进,仿真结果表明,在不同噪声下,基于改进的端点检测算法在低信噪比条件下的检测准确率明显高于传统的基于能量和过零率的双门限检测算法,其中基于改进的频带方差的检测效果最好。最后深入研究了基于DTW和HMM的语音识别方法。其中基于DTW的高效算法具有运算复杂度低的特点,仿真结果表明,它非常适合于小词汇量、特定人的语音识别,识别率可以达到100%。但是对于非特定人识别,本文选用主流的基于HMM的识别方法,并仔细探讨了CHMM应用到语音识别中的具体问题。结合改进的端点检测算法并采用基于CHMM的语音识别方法,最终实现了对自建的汉语孤立数字语音库92%的平均识别率。
其他文献
本文提出了一种基于ARM平台和嵌入式Linux操作系统的远程视频监控系统的解决方案。伴随着网络技术和多媒体技术的飞速发展,视频监控技术向着网络化、数字化、智能化的方向发
目前,学术讲座视频已经成为读者获取知识的一种重要途径。然而,学术讲座视频的数量每天都在增长,面对大量的学术讲座视频,读者找到自己感兴趣的视频进行快速浏览并定位关注的部分
学位
学位
视频编解码技术、嵌入式操作系统以及网络技术的进步,极大地推动了视频监控技术向数字化和网络化的发展。编解码技术极大地节省了视频数据的存储空间,网络化实现了异地监控及
异构网络针对重载和宏蜂窝小区边缘用户吞吐量低,通过添加新的节点如毫微微蜂窝基站和微微蜂窝基站来覆盖宏蜂窝小区解决此问题。对于现有研究,毫微微蜂窝基站关注于室内覆盖
随着移动通信技术的发展和人们对定位信息的需求,获取移动台位置信息的无线定位技术及其算法已经成为当前的研究热点。在3G时代中,无线定位技术也必将成为第三代移动通信系统中
随着视频技术的迅速发展和应用,用2D视频描述的世界已不能满足观众日益增长的视觉需求。而3D视频描述的世界与人的视觉更加匹配,使人们在观看时能获得丰富的立体感和沉浸感。
目前中国已经成为世界上移动通信发展最快的国家,拥有世界上最大的移动通信网(包括GSM和CDMA网)。对于GSM网络,在经历了前一阶段大规模的投资建设之后,运营商的工作重心已经
高光谱遥感图像凭借其较高的光谱分辨率,具有区分微小光谱差异地物的能力,且不需要任何先验光谱信息,因而具有较强的实用性,现已成为目标检测领域中的一个研究热点,受到国内外学者的高度重视。本文在深入分析高光谱图像数据结构及特点的基础上,运用现代信号处理技术,针对高光谱图像异常检测中的高数据维、波段间非线性相关性、混合像元中背景信息对异常检测的干扰等问题,做了以下三方面的研究:首先,在研究高光谱图像数据降
随着Internet技术的飞速发展,在Internet上进行语音交互变得越来越普及。VoIP技术已成为网络界受关注最多、发展最快的技术之一。然而作为IP语音传输媒介的IP网络目前存在着