基于NLIDB的交互问答系统的研究

来源 :厦门大学 | 被引量 : 0次 | 上传用户:ww830625
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据库自然语言接口(NaturalLanguageInterfacetoDatabase,NLIDB)因其简化了人机交互的过程,使用户可以用自己熟悉的语言查询数据库而广受欢迎,因而自然语言查询接口的研究具有重要的理论意义和研究价值。实验室课题组已经初步实现了一个数据库自然语言接口,可以支持较复杂的自然语言查询。该数据库自然语言接口可处理一系列不相关的问题,但对于前后关联的问题尚不能处理,具有局限性。本文在原数据库自然语言接口的基础上,对交互问答及相关技术进行了研究,主要包括语义网络的构建、指代消解和用户反馈等,研究成果主要有:  (1)构建了一个基于知网(HowNet)的语义网络,用以解析问句中相关词语的语义,保证交互问答流程的实现。该语义网络基于HowNet中的义原和概念而构建,将义原组织成义原树,将概念拆分成基本义原并与义原树连接。通过义原树的层级关系可以得到一个概念的各种属性,比如概念是否指人、概念的单复数性质等,具有很高的通用性和实用性。  (2)实现了一个基于规则和机器学习相结合的汉语人称代词消解系统,通过消解问题中的人称代词,完成对一系列相关问题的处理。当今的指代消解技术正从单一的基于规则的技术向基于机器学习的技术发展,本文提取出了包括句法信息、语义信息等在内的十三个特征属性,首先采用基于规则的方法进行过滤,排除掉属性冲突的指代对,然后利用训练好的C4.5决策树进行消解。实验表明,消解的F指数达到88.7%,具有良好的效果。  (3)实现了一个基于数据库自然语言接口的交互问答系统,将指代消解与NLIDB相结合,用以处理一系列含有人称代词的前后关联问题。由于NLIDB具有一问一答的特点,因此问题中的代词指代的只能是之前句子中出现的名词,而且该名词与代词的距离不会太远。这个特点使得指代消解更加具有针对性,准确率更加有保证。该系统同时利用指代消解中产生的候选项和构建的常问问题库,实现了用户反馈模块,该模块可提供一至三个候选问题供用户选择,提高了系统的交互性。  最后将该系统应用于五个领域,用以验证本文实现的基于NLIDB的交互问答系统的有效性和可移植性。五个领域分别为教务信息查询领域、列车信息查询领域、彩票信息查询领域、天气信息查询领域、NBA赛事信息查询领域。实验表明,该系统基本能够有效的处理多种查询。
其他文献
图像分类是当前计算机视觉研究的热点。该问题涉及两个重要的因素:一是图像的表示;二是分类算法的设计。在图像的表示上,词袋模型在信息检索领域的成功应用启发计算机视觉研究
近几年来,云计算技术已成为IT界最热门的研究领域,它改变了企业传统的IT技术架构和开发部署模式。通过网络方式提供给用户需要的应用平台环境,快速平滑地将用户的应用迁移到云中
作为信息安全的热点研究领域之一,安全多方计算(Secure Multiparty Computation)主要研究多方合作计算问题,即分布式网络中互不信任的两个或者多个参与者合作执行某种计算任
膜计算(又称P系统)是从生命细胞的结构与功能以及组织和器官中细胞群的协作中抽象出来的计算模型。P系统是一类分布式、并行性计算模型。从结构上看,P系统有三种形式:细胞型P系统
垃圾网页是指网页制造者采用迷惑或欺骗搜索引擎的手段,使得网页在检索结果中的排名高于实际排名的行为。这种页面不仅影响搜索引擎检索的准确率和效率,也严重恶化了用户的搜
随着嵌入式技术、传感器技术、网络技术以及无线通信技术的不断发展,无线传感器网络作为一种新兴的“智能”网络受到了人们广泛的关注。无线传感器网络已经应用到了人类生产
闪存作为一种新型的非易失性固态存储器,由于其体积小、非易失、读写速度快、抗震性强以及能耗低等优良特性被广泛应用于各领域的存储产品中,尤其是近年来基于闪存的固态硬盘技
二维动画以其独特的风格深深吸引着广大爱好者和研究者,由于其具有丰富的表现力,因此也别广泛应用于娱乐、广告、教育等领域。但是,由于二维动画的制作过程十分复杂,产生的周期长
本文研究的是单帧图像的超分辨率重建问题。重点关注图像柔边重建效率和稀疏重建算法,并在改进的基础上将它们联合起来,其中柔边重建关注的是柔化边缘锯齿,稀疏重建运用字典库的
在软件系统中,有许多需要定期执行的任务。按照当前的业界通用做法,这些任务主要是通过操作系统的定时调度服务来运行的,如Unix和Linux系统的crond服务。这种方式相对简单,对小型