特定领域人机会话系统的研究与实现

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:suease
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机的发展,用自然语言进行人机会话已趋必然。基于隐马尔柯夫声学模型的语音识别技术不断成熟,语音合成技术逐渐步入实际应用阶段,实现人机语声接口这一具有重大实用价值课题的研究已成为可能。但是,这也对语言文字处理的深度和广度提出越来越高的要求。这个问题在西方国家并不突出,因为计算机从诞生之日开始,就是以处理西方语言为基础的。他们很自然地主动研究和解决计算机如何不断地适应自己国家的语言文字问题。可是汉语与西方语言的差别很大,能够处理西方语言的计算机,面对汉语的理解、生成等处理问题却显得无能为力。因此,近几年来中文信息处理技术已经越来越多地受到了专家、企业和政府的重视。 本文讨论了人机会话系统的两个问题,语音识别错误的自动纠错和汉语的语义理解。并在综合各项中文信息处理技术的基础上实现了一个上海市内交通信息的电话语音查询系统。其特点为:用户与计算机完全用自然语言进行交流,有别于目前流行的以孤立词语音识别为基础并辅以按键导航的语音自动应答系统,使用户的选择更加方便、快捷。 本查询系统由语音识别、自然语言处理和文语转换三大处理模块组成。语音识别引擎将语音信号转化为书面文本;而后由自然语言处理模块对识别文本进行切分、标注、语义理解,并自动生成对话文本;最终对生成文本进行文语转换,产生语音信号并反馈给用户。 在现阶段,由于语音识别的不完善,识别正确率不高。本文根据汉语的特点,通过总结在汉语语音识别中出现错误的规律,定义了相应的用于查错和校正的语义和语用规则。利用“词汇语义驱动”的分析方法,找出语音识别序列中的错误并校正,很大程度上缓解了语音识别错误对后续文本处理工作的消极影响。现在对语音识别技术的研究主要集中于语言的声学特征上,结合语言的语法、语义和语用特征的研究还不多,本文的研究能对语音识别技术的进一步完善有所启迪。 在人机会话系统中,对话理解是其中的核心部分,也是系统实现的难点。从目前的情况看,许多实现系统采用了例句匹配、关键字识别、信息提取等技术手段,但由于缺乏对语义解释的形式化表示,因此对自然语言语句理解的准确程度都不高。为此,本文引入类型逻辑语义学作为汉语语义分析的手段,并结合限定领域中的应用,分析了对话实例中的语句语义,希望能在解决中文语义形式化的问题上做出有益的尝试。
其他文献
随着我国社会主义市场经济的基本确立,完善的社会保险体系欲发显得重要,它和每个人的切身利益密切相关。社会保险具有三个突出的特点:一是信息处理量大,要掌握单位、个人的基本情
在数据库尤其是数据仓库领域,如何加快查询执行速度非常重要。除了对查询进行优化外,另外一种方式就是用物化视图改写查询。物化视图不同于一般的视图,它们不仅存储了视图的定义
在充分分析现有IDS实现技术基础之上,给出了一种分布式入侵检测系统DIDS的设计思想和总体架构.DIDS融合多种入侵检测技术,采用分布式、多代理、分层检测的体系结构以及统一的
该文主要介绍作者在3G安全方面取得的一些跟踪/分析和技术/研究的成果,包括:(1)跟踪分析-①标准跟踪:详细分析并总结3G标准组织和3G安全标准的最新进展情况;②需求分析:详细
智能卡服务提供者向上层应用提供最基本的智能卡服务,它包括最基本的与智能卡通讯、智能卡认证、文件的访问以及其他行业相关的服务的封装.针对智能卡特殊的运行模型,类比web
通过对嵌套循环、排序合并、索引与哈希连接等几种经典的基于数据划分的并行连接算法进行深入分析,提出在实现过程根据内存与关系大小比例动态选择连接策略的改进算法,解决了
工作流就是将一些工作任务联系起来实现整个的经营过程。在整个过程中制定一些执行顺序和条件,各个活动按照这些顺序和条件依次执行。在市场竞争日益激烈的当今社会,企业为了
本文介绍了一个基于J2EE框架的多层数据挖掘(Data Mining)原型系统。它利用Rational公司的Rose工具进行系统的UML面向对象可视化建模,并使用Sun公司的Java Web Start进行客户
国内外相关研究方向的调研显示:国内外对内容调度的研究主要集中在调度算法上,很少有完整的系统实现,尤其在Linux环境下;另外,尚未见到有关基于内容的通用调度系统的研究.为
CIMS环境下决策支持系统(DSS)构成一种信息集成的立体空间,是一种信息大、结构复杂的巨系统.迄今,尚无完善设计方法.系统集成环境下的模糊决策支持系统(FDSS)面临两大主要问