受限领域问答系统中问题理解技术的研究

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:sea0075
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
问答系统(Question Answering System,QA)是新一代智能搜素引擎,它允许用户以自然语言提问,并能够向用户返回准确的答案。与传统的关键词搜索引擎相比,问答系统能够更好满足用户对快速、准确地获取信息的需求。在受限领域中,基于问题库的问答系统在对问题答案的定位上,有更准确,快捷和高效的特点,在日常生活的各个领域中,有着重要的应用前景,是目前研究的一个热点问题。问句理解是问答系统的一个非常重要的组成部分,它的准确性直接影响到系统的准确率。本文主要利用自然语言处理技术,对领域知识库的建立,中文问句的理解,问句相似度的计算等问答系统关键技术进行深入探讨和研究,并在此基础上实现面向电信产品信息的领域问答系统。具体来说,本文主要的实际性工作和取得的主要成果如下:   1.利用词语在专业语料库和背景语料库出现的概率对比作为特征实现领域术语的自动抽取,并利用知网对知识的描述方法,建立领域知识库;   2.提出一种问句语义理解模型。该方法通过对问句的问句焦点,问句的依存文法和问句成分的语义角色进行深入的分析,将问句的词汇归入各个语义块中,并对各个语义块进行扩展,构成问句的语义理解模型;   3.研究和分析当前问句相似度计算方法的不足,结合领域内汉语问句的语义理解模型,提出一种基于问句语义理解模型的相似度计算方法。该方法以知网和领域知识库为基础,计算词语之间语义相似度,在语义理解模型的基础上计算问句间的相似度,从而实现了融合词法、句法、语义以及领域知识的领域问句相似度计算。实验结果表明,该方法具有良好的效果;   4.利用上述研究成果,并以电信产品信息领域为例,收集领域词汇和领域FAQ,并对领域知识库建立索引,实现面向电信产品信息的问答系统原型。  
其他文献
Fuzzy C-Means(FCM,模糊C均值聚类)属于基于划分的聚类算法类别,自算法提出至今已40余年,众多学者深入研究发展出大量改进型算法,被用以分析处理来自各行各业、种类繁多的数
随着嵌入式技术的发展和无线通信技术的广泛应用,以移动智能终端为载体的移动地理信息系统(Mobile GIS)已成为地理信息系统研究的热点。嵌入式GIS是集导航、定位、地图查询和空
随着信息化时代的到来,数据库技术不断发展,数据库中存储的数据量急剧增加,如何从海量数据中找出人们最感兴趣的信息,为人们做出有效的决策服务,成为了一项重要的研究课题。Skylin
随着当今世界的技术的进步,机器人在很多情况下代替了人在远端作业,特别是一些危险的工作环境。机器人的虚拟仿真技术应运而生,其使得操作者在遥操作中对远端的工作环境有了虚拟
血液透析技术被广泛应用于肾脏病患者的治疗当中,血液透析机则是血液透析治疗中的主要设备之一。正确诊断血液透析机的故障类型对提高血液透析治疗安全性具有重要的意义和实用价值。本文针对血液透析机的故障特点采用了自组织特征映射(S0M)神经网络对其进行了诊断研究。具体如下:首先,阐述了血液透析治疗的发展历程和神经网络技术的发展历程,并针对于自组织特征映射神经网络做了研究。根据血液透析机的工作过程总结了血液透
数据挖掘是数据处理的一种重要研究方法,关联规则挖掘是数据挖掘技术中的一个重要的研究方向。传统的关联规则挖掘算法大都认为产生的关联规则是永恒有效的,没有考虑到规则的变
随着仿人机器人硬件水平的不断提高,仿人机器人的研究领域不断被拓宽和深入,已经成为了机器人学研究中最受瞩目的课题之一。其中,直立行走的步态规划是仿人机器人技术的基础和重
本文简要介绍了数字水印的研究背景和国内外的发展状况,系统地阐述了数字图像水印和数字音频水印的基本原理和典型算法,并对水印的攻击手段和水印的性能评价作了详细的介绍。