口语对话系统中文法规则自动推导研究

来源 :河南师范大学 | 被引量 : 0次 | 上传用户:huhuairen
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于规则的口语对话系统中的文法规则通常由领域专家和计算机语言学家手工设计,需要依赖专家的专业知识和经验,这对于普通开发人员来说是无法完成的。另外,手工设计的文法移植性差,根据某一领域设计的文法规则很难移植到其他领域继续使用,同样功能的口语对话系统对于不同领域都需要领域专家重新设计文法规则,存在大量的重复劳动,造成巨大的人力和物力浪费。随着社会需求的不断增大,系统规模空前扩大,文法规则的获取成了口语对话系统研发的主要瓶颈。 本文针对口语对话系统中语言的特点,以一种上下文无关增强文法为对象,对口语对话系统中文法规则的自动获取技术进行了研究。主要工作包括: (1)对比分析常见形式文法的特点和性能,重点研究一种符合汉语口语特点的上下文无关增强文法,根据口语对话系统中语言的特点,选定该文法为对象进行文法规则自动推导技术的研究。 (2)提出一种基于句子分割的文法规则自动推导算法。基本思想是:用初始规则集对训练例句进行分析,若不能得到完整的语法树,则先对分析得到的片断进行消歧和归一化,然后根据顶层片断递归地推导出缺少的文法规则,并更新已有的规则集。研究歧义片断的消除和归一化策略,为了提高算法性能,探讨并给出一种算法的改进方案。 (3)研究面向领域任务的文法测评方法,给出一套灵活的、可领域定制的文法评测方法。使用该方法在天气预报查询领域对算法的输出文法进行评测,结果显示,输出文法的句法分析准确率在初始规则集为空时达到了64.8%,在初始规则集只包含日期相关规则时达到了86.4%。
其他文献
信息技术的日新月异使得各个领域的数据量激增,在此背景下诞生的知识发现和数据挖掘给人们提供了一种新的认识数据、理解数据的智能手段。序列模式发现是其中的一个重要研究
虹膜识别是模式识别领域的前沿研究方向,是一种新颖的基于生物特征的身份鉴别方法,也是一项具有广阔应用前景的身份认证技术,在信息及安全领域有着重要的应用价值,业已得到国内外
随着数字图象的应用日益广泛,数字图象编辑处理工具越来越先进,利用这些工具精心修改过的图象很难发现其改动痕迹,图象篡改的事件屡见不鲜。当前,数字图象认证成为了现在研究
可视化是分析处理大规模复杂数据场的重要手段,已经成为科学研究、工程设计等领域不可或缺的工具。直接体绘制方法能反映数据场的整体分布情况,因此成为最重要的体数据绘制方
随着计算机技术和网络技术的飞速发展,计算机网络对于社会政治、经济和军事等方面重要部门的影响越来越大。但目前的网络组件,不论是硬件还是软件,不论是交换设备还是端设备,都存
随着动漫产业的不断发展壮大,动画制作也从传统的二维动画转变到现在主流的三维动画,三维动画带给人们更加真实逼真的感觉,但是三维动画的渲染是一项很复杂的计算,往往很耗时,单机
随着互联网的普及和科技的发展,包括新闻网站、微博在内的网络平台逐渐成为大众获取信息的重要渠道。面对各网络平台上海量的数据信息,如何快速从中获取自己需要的信息已经成
电力载波传感器网络采用低压电力线作为物理传输信道,通信信道的时变性、噪声干扰强及信号衰减大等固有特点易造成网络链路不稳定、拓扑结构复杂。网络运行时,某些节点容易失效
信息隐藏是在图像、音频、视频等数字媒体中嵌入不可察觉的隐蔽数据。隐藏检测就是以各种手段检测这些可疑信息的存在。有些类型的媒体信号因为广泛流行,而且便于传播和流通,
学位