受限域中文问答系统问句分析研究

被引量 : 0次 | 上传用户:cbladerunner
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
问答系统是新一代智能搜索引擎,它允许用户以自然语言提问,并能够向用户返回准确的答案。与传统的搜索引擎相比,问答系统能更好的满足用户的查询要求,更准确地检索出用户所需要的答案。问句分析是问答系统的一个非常重要的组成部分,它的准确性直接影响到最终答案抽取的准确性。本文主要利用自然语言处理技术,对受限域中领域知识库的构建,问句表征,问句分类,问句相似度计算等问答系统关键技术进行探讨与研究,并在此基础上实现了一个云南旅游FAQ库的问答系统。具体说来,本文主要取得了以下几个较有特色的成果:(1)针对“知网”常识库缺乏对领域概念的描述问题,提出了一种领域知识的表示、领域本体的提取与构建方法。该方法借助本体论的思想,采用“知网”的概念描述语言对领域术语概念进行精确描述,从而建立领域知识库,并实现领域知识库与常识库的融合。(2)提出了一种问句信息的形式化表示(问句表征)方法。该方法利用词法、语义分析实现领域问句关键字的提取与扩展,利用问句句法依存分析提取问句的句法依存树,通过问句类型与问点及答案类型映射规则来获取问句的问点及答案类型。(3)提出了一种基于规则和统计学习相结合的领域问句分类的方法。该方法首先利用语言规则与领域知识的特点提取问句类别规则;然后通过提取句法结构关系和领域特征,并采用改进贝叶斯分类学习算法,构造问句分类模型;最终结合规则的方法和统计学习的方法,实现领域问句分类,实验结果表明,该方法具有较好的效果。(4)针对当前问句相似度计算方法的不足,结合领域内汉语问句的特点,提出了一种领域问句相似度的计算方法。该方法以领域知识库及常识库为基础,计算词语之间语义相似度,提取问句句法依存对,并计算问句中依存对之间的相似度,从而实现了融合词法、句法、语义及领域知识的领域问句的相似度计算。实验结果表明,该方法具有较好的效果。(5)利用上述研究成果,并以云南旅游领域为例,收集整理领域特征,实现云南旅游FAQ库的问答原型系统。
其他文献
体育教学是实现学校体育目的任务的基本途径,职业教育是以培养中等技术劳动者为目标,以培养综合职业能力为核心,适应广泛就业需要的职业素质教育。职业技术学校体育教学有其
红色资源是中国共产党领导我国人民在新民主主义革命到社会主义建设时期所形成的能为我们今天所开发利用的伟大精神及其物质载体的总和。它在思想政治教育中拥有着不可估量的
雾和霾在我国出现的比较频繁且分布区域较广,这不仅影响室外景物的视觉呈现,而且会引起户外拍摄图像的降质,使得图像信息部分或者大量丢失。因此,有必要寻找更为有效的图像去雾技术,来减少或者消除图像中雾气的影响,提高图像的质量。本文基于颜色衰减先验的图像去雾算法,提出了一种改进的颜色衰减先验去雾算法并在FPGA上对该算法进行实现和验证。本文主要研究内容和结论如下:首先通过分析图像降质的原因,引出了可用于还
在近代中国.随着西方殖民侵略的逐步加深,“海防”、“塞防”问题成为清政府关注和争论的焦点。林则徐作为清政府的一名封疆大吏.在谪戊新疆的过程中,他以“谪宦”之名,逐一实现他
在创业研究领域,学者们认为经验学习是创业学习的关键。创业者通过对先前经验进行学习,改变创业知识、能力和绩效。先前经验对创业知识、创业能力以及创业绩效具有重要的影响
政府机构是政府管理体制和运行机制的载体,机构人员编制是政府职能得以施行,机构得以运转的物质基础,是实现政府管理目标的保障。政府机构编制调整既是政府组织内部管理模式
在构建“以就业为导向”的中等职业教育模式的过程中,各中职校顺应社会需求,改革培养目标,将传统的“学历教育”变革为真正的“职业教育”,培养与职业岗位要求贴近的实践性、
目的:探讨新生儿化脓性脑膜炎预后的影响因素,以便在疾病早期给予足够的重视,积极地进行治疗和干预,改善患儿预后。方法:采用回顾性研究方法,分析2010—2014年在重庆医科大学
近红外光谱技术(NIRS)可预测高蛋白饲料中氨基酸和可消化氨基酸的含量,这些数据对饲料质量监控很有用。通过这些数据,可以发现采进饲料原料中的等外品,还可以根据相关的营养参数对每宗
目前我国中小学生身体素质呈“稳中向好”趋势,但因身体活动不足导致的各年龄段学生肥胖等慢性疾病发病率持续上升的局面仍未得到根本扭转。文章对社会生态模型在身体活动健