论文部分内容阅读
近年来,在语音信号信息处理中,语音识别技术应用研究不断深入,语音信息的自然语言处理NLP(Natural Language Processing)的统计处理方法不断成熟,但其规则处理方法依然薄弱。语音识别ASR(Automatic Speech Recognition)遇到了模糊音识别语义理解的障碍,影响了人工智能 AI(Artificial Intelligence)的人机对话 HCI(Human Computer Interaction)的进展[2]。本文主要针对同音词等模糊音的语音识别技术障碍,采用语言规则处理的方法,研究解决了语音识别的后端处理问题,提出了语音识别的语义分析深度处理前沿技术。本文首先简述了语音识别和语义分析的研究背景和技术方法,指出了目前语音识别语义分析所面临的困境,说明了迫切需要突破汉语语音识别技术瓶颈的重要性,提出了一种语义分析技术的解决方案;其次,研究总结了基于汉语活性规则的语义活性算法SAA(Semantic Activity Algorithm);然后,建立一种语音识别的语义框架及识别模式,适合处理经过数理统计方法语音识别后仍然存在的模糊性语音的识别;最后,提出了一个语音识别后端深度处理模糊音的语义分析方法,由活性标识、分词、模式识别、语义表示等步骤组成,处理了包括语音构成、口音习惯、发音误差、口语变音、语言混合交叉等方面产生的模糊音语音,取得了比较有益的效果。本文研究的语音活性识别技术方法,在隐马尔科夫模型(HMM)、贝叶斯方法(BA)、人工神经网络(ANN)、机器学习(ML)等统计方法语音识别技术的前端处理基础上,提出了语言规则方法语音识别技术的新途径,其创新点在于率先提出了解决同音词、近音词等高难度模糊音的语音识别的语义分析前沿技术,为实现人机对话语言理解打下了坚实的基础。本文也指出了上下句关联语音语句等需要进一步研究处理的语音识别问题。