基于多模型矢量泰勒级数的语音识别系统优化

来源 :东南大学 | 被引量 : 0次 | 上传用户：huoqiyin

【摘要】

：

在理想的实验室环境下,语音识别系统具有很高的识别率,但是在实际环境下,由于各种噪声的干扰,降低了实际应用环境下的语音识别性能,论文将从前端的端点检测和后端的拒识别两

【作者】

：

丁佳佳

【机构】

：

东南大学

【出处】

：

东南大学

【发表日期】

：

2015年期

【关键词】

：

子带谱熵端点检测拒识多环境模型

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

在理想的实验室环境下,语音识别系统具有很高的识别率,但是在实际环境下,由于各种噪声的干扰,降低了实际应用环境下的语音识别性能,论文将从前端的端点检测和后端的拒识别两方面入手,进行系统优化,以提高语音识别系统性能、尤其是低信噪比环境下的识别性能。论文的主要工作包括：(1)分析了语音识别系统结构,包括预处理、特征提取和建模。预处理主要对语音信号进行预加重、分帧加窗、端点检测；提取美尔频率倒谱系数(MFCC:Mel-Frequency Cepstral Coefficients)及其一阶差分倒谱系数,作为语音识别系统的特征参数；利用隐马尔科夫模型(HMM:Hidden Markov Mod el)对语音信号进行声学建模。(2)实现了基于子带能量谱熵的端点检测算法,优化了系统的端点检测模块。子带能量谱熵参数不仅可以表征低信噪比环境下的语音信号特征,而且对不同种类的噪声有一定的鲁棒性。测试结果表明,在低信噪比环境下,基于子带能量谱熵的端点检测效果要优于原先的双门限端点检测：端点检测模块的优化大幅提高VTSME(VTS-based Multi-Environment)语音识别系统的识别性能,尤其是在低信噪比环境下的识别性能。(3)为语音识别系统增加了拒识模块。本文对语音长度过短、环境信噪比过低和对可能识别错误的孤立词进行拒识这三个方面进行研究,其中重点研究了基于后验概率差值的拒识算法。通过拒识噪声大、语音短和区分度低的测试语音,大幅度提高了系统识别准确率,而基本没有增加系统复杂度,保证了系统的实时性。(4)在MATLAB平台上进行的仿真实验基础上,实现了C平台的优化算法。将优化部分移植到C平台,完成了对实时的非特定人孤立词识别系统的优化。实验结果证明,优化使语音识别系统的识别性能得到了大幅度提升。

其他文献

基于WCCs码的IDMA系统仿真设计

近几年来，交织多址接入(Interleave Division Multiple Access)技术作为第四代移动通信的关键技术之一被广泛的研究。IDMA系统不仅继承了CDMA系统的许多优势，特别是抗干扰性好，

学位

编织卷积码交织多址接入抗干扰性频谱效率仿真设计

基于VOIP的EPON语音接入研究

随着IP网络的发展，VOIP技术得到了较大的飞跃，其低廉的话费使得越来越多的人开始使用IP电话。VOIP正朝向NGN体系结构演进，而NGN采用一种开放的体系结构，随着NGN网络的建设和发展，V

学位

IP网络IP电话宽带接入无源光网络语音接入接入网关

无线传感器网络的TCP性能改进

无线传感器网络是一种全新的信息获取和处理技术，在军事、环境、医学、空间探索以及工业、民用等领域具有广泛的应用前景。因此，无线传感器网络技术被称为21世纪最重要的前沿技

学位

无线传感器网络数据可靠性拥塞控制传输控制协议

基于计算机视觉的果蔬自动分类技术中的特征分析的研究

我国作为果蔬生产大国,果蔬超市化销售已经成为主要形式。但是在售卖过程中,果蔬分类也即价格依旧主要靠人工记忆或者查询,消耗了大量人力、物力、财力等资源。为了解决存在

学位

计算机视觉果蔬分类Gabor均值方差特征SVM多特征调和自适应融合

MIMO信号盲识别方法研究

近来的研究表明，多输入多输出(MIMO，Multiple Input Multiple Output)技术可以显著提高无线通信系统的频谱利用率。但是，目前的研究主要是在协同通信环境下进行，即假设已知源信号

学位

移动通信多入多出信号检测盲识别技术

TD-SCDMA系统无线定位方法研究

未来移动通信系统将给人们带来更高的话音质量，更丰富的多媒体业务和更多的增值业务，其中的无线定位业务被公认为未来最具有吸引力的增值业务之一。作为移动通信3G标准之一的TD

学位

移动通信无线定位AOA估计相干分布源角度扩展蜂窝网络

基于SOPC技术的嵌入式掌纹识别系统设计与实现

可重用设计方法源于SoC(System on a Chip片上系统)的设计人员对大规模复杂芯片设计方法的总结和归纳,即使用以前设计完成且已经过验证的知识产权核(IP核)构建系统芯片的设计

学位

掌纹识别NIOSFPGASOPC可重用设计

OFDM系统峰平比抑制技术研究及逻辑实现

移动通信是当前发展的热点,作为第四代移动通信核心的OFDM技术受到人们的广泛关注。OFDM技术有很多优点,具有很强抗多径衰落、码间干扰和窄带干扰能力,并且具有很高频谱利用

学位

OFDM峰平比FPGA

基于ARM的热风炉自动控制系统的接口设计与实现

矿井加暖系统在矿产、冶金、化工等工业中具有广泛的应用。课题组根据热效率、寿命、自动化程度等方面存在的问题,经过调查、分析和研究开发了一套新型矿用环保热风炉系统,该

学位

热风炉数据采集输出控制MSP430

双耳环型阵列空间听觉研究

空间听觉是指通过物理和心理的方法再现声学事件，使处于重现声场中的听众有身临其境的听觉感知。双耳声信号重放技术是空间听觉重放技术中的一种，它通过重现双耳处的声压信号使

学位

空间听觉环型麦克风阵列微型扬声器阵列传输函数

基于多模型矢量泰勒级数的语音识别系统优化

其他学术论文