【摘 要】
:
在理想的实验室环境下,语音识别系统具有很高的识别率,但是在实际环境下,由于各种噪声的干扰,降低了实际应用环境下的语音识别性能,论文将从前端的端点检测和后端的拒识别两
论文部分内容阅读
在理想的实验室环境下,语音识别系统具有很高的识别率,但是在实际环境下,由于各种噪声的干扰,降低了实际应用环境下的语音识别性能,论文将从前端的端点检测和后端的拒识别两方面入手,进行系统优化,以提高语音识别系统性能、尤其是低信噪比环境下的识别性能。论文的主要工作包括:(1)分析了语音识别系统结构,包括预处理、特征提取和建模。预处理主要对语音信号进行预加重、分帧加窗、端点检测;提取美尔频率倒谱系数(MFCC:Mel-Frequency Cepstral Coefficients)及其一阶差分倒谱系数,作为语音识别系统的特征参数;利用隐马尔科夫模型(HMM:Hidden Markov Mod el)对语音信号进行声学建模。(2)实现了基于子带能量谱熵的端点检测算法,优化了系统的端点检测模块。子带能量谱熵参数不仅可以表征低信噪比环境下的语音信号特征,而且对不同种类的噪声有一定的鲁棒性。测试结果表明,在低信噪比环境下,基于子带能量谱熵的端点检测效果要优于原先的双门限端点检测:端点检测模块的优化大幅提高VTSME(VTS-based Multi-Environment)语音识别系统的识别性能,尤其是在低信噪比环境下的识别性能。(3)为语音识别系统增加了拒识模块。本文对语音长度过短、环境信噪比过低和对可能识别错误的孤立词进行拒识这三个方面进行研究,其中重点研究了基于后验概率差值的拒识算法。通过拒识噪声大、语音短和区分度低的测试语音,大幅度提高了系统识别准确率,而基本没有增加系统复杂度,保证了系统的实时性。(4)在MATLAB平台上进行的仿真实验基础上,实现了C平台的优化算法。将优化部分移植到C平台,完成了对实时的非特定人孤立词识别系统的优化。实验结果证明,优化使语音识别系统的识别性能得到了大幅度提升。
其他文献
近几年来,交织多址接入(Interleave Division Multiple Access)技术作为第四代移动通信的关键技术之一被广泛的研究。IDMA系统不仅继承了CDMA系统的许多优势,特别是抗干扰性好,
随着IP网络的发展,VOIP技术得到了较大的飞跃,其低廉的话费使得越来越多的人开始使用IP电话。VOIP正朝向NGN体系结构演进,而NGN采用一种开放的体系结构,随着NGN网络的建设和发展,V
无线传感器网络是一种全新的信息获取和处理技术,在军事、环境、医学、空间探索以及工业、民用等领域具有广泛的应用前景。因此,无线传感器网络技术被称为21世纪最重要的前沿技
我国作为果蔬生产大国,果蔬超市化销售已经成为主要形式。但是在售卖过程中,果蔬分类也即价格依旧主要靠人工记忆或者查询,消耗了大量人力、物力、财力等资源。为了解决存在
近来的研究表明,多输入多输出(MIMO,Multiple Input Multiple Output)技术可以显著提高无线通信系统的频谱利用率。但是,目前的研究主要是在协同通信环境下进行,即假设已知源信号
未来移动通信系统将给人们带来更高的话音质量,更丰富的多媒体业务和更多的增值业务,其中的无线定位业务被公认为未来最具有吸引力的增值业务之一。作为移动通信3G标准之一的TD
可重用设计方法源于SoC(System on a Chip片上系统)的设计人员对大规模复杂芯片设计方法的总结和归纳,即使用以前设计完成且已经过验证的知识产权核(IP核)构建系统芯片的设计
移动通信是当前发展的热点,作为第四代移动通信核心的OFDM技术受到人们的广泛关注。OFDM技术有很多优点,具有很强抗多径衰落、码间干扰和窄带干扰能力,并且具有很高频谱利用
矿井加暖系统在矿产、冶金、化工等工业中具有广泛的应用。课题组根据热效率、寿命、自动化程度等方面存在的问题,经过调查、分析和研究开发了一套新型矿用环保热风炉系统,该
空间听觉是指通过物理和心理的方法再现声学事件,使处于重现声场中的听众有身临其境的听觉感知。双耳声信号重放技术是空间听觉重放技术中的一种,它通过重现双耳处的声压信号使