论文部分内容阅读
随着计算机的发展,用自然语言进行人机会话已趋必然。基于隐马尔柯夫声学模型的语音识别技术不断成熟,语音合成技术逐渐步入实际应用阶段,实现人机语声接口这一具有重大实用价值课题的研究已成为可能。但是,这也对语言文字处理的深度和广度提出越来越高的要求。这个问题在西方国家并不突出,因为计算机从诞生之日开始,就是以处理西方语言为基础的。他们很自然地主动研究和解决计算机如何不断地适应自己国家的语言文字问题。可是汉语与西方语言的差别很大,能够处理西方语言的计算机,面对汉语的理解、生成等处理问题却显得无能为力。因此,近几年来中文信息处理技术已经越来越多地受到了专家、企业和政府的重视。
本文讨论了人机会话系统的两个问题,语音识别错误的自动纠错和汉语的语义理解。并在综合各项中文信息处理技术的基础上实现了一个上海市内交通信息的电话语音查询系统。其特点为:用户与计算机完全用自然语言进行交流,有别于目前流行的以孤立词语音识别为基础并辅以按键导航的语音自动应答系统,使用户的选择更加方便、快捷。
本查询系统由语音识别、自然语言处理和文语转换三大处理模块组成。语音识别引擎将语音信号转化为书面文本;而后由自然语言处理模块对识别文本进行切分、标注、语义理解,并自动生成对话文本;最终对生成文本进行文语转换,产生语音信号并反馈给用户。
在现阶段,由于语音识别的不完善,识别正确率不高。本文根据汉语的特点,通过总结在汉语语音识别中出现错误的规律,定义了相应的用于查错和校正的语义和语用规则。利用“词汇语义驱动”的分析方法,找出语音识别序列中的错误并校正,很大程度上缓解了语音识别错误对后续文本处理工作的消极影响。现在对语音识别技术的研究主要集中于语言的声学特征上,结合语言的语法、语义和语用特征的研究还不多,本文的研究能对语音识别技术的进一步完善有所启迪。
在人机会话系统中,对话理解是其中的核心部分,也是系统实现的难点。从目前的情况看,许多实现系统采用了例句匹配、关键字识别、信息提取等技术手段,但由于缺乏对语义解释的形式化表示,因此对自然语言语句理解的准确程度都不高。为此,本文引入类型逻辑语义学作为汉语语义分析的手段,并结合限定领域中的应用,分析了对话实例中的语句语义,希望能在解决中文语义形式化的问题上做出有益的尝试。