基于语义Web的智能问答系统的研究与实现

被引量 : 14次 | 上传用户:zhouyang340345
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的普及,网上信息越来越丰富。但是,传统搜索引擎有很多不足之处,它返回的是许多相关的网页,而不是准确的答案,系统的查准率很低。另外,它仅以关键词索引或全文检索,没有触及到语义信息,因此很难真正理解用户的意图。而在智能问答系统(Intelligent Question Answering System, IQAS)中,用户可以使用自然语言进行提问,系统通过对问题分析和理解,直接返回答案给用户。因此问答系统更好地满足了用户的要求。可以说,IQAS是新一代的搜索引擎。近年来,本体(Ontology)受到人工智能领域的普遍关注,并得到了广泛应用。在受限领域问答中采用本体知识库,可以更好的表示知识之间的内在关系,知识的组织更加合理,减少冗余存储,也有利于进行基于语义的答案抽取。本文在研究国内外主流IQAS的前提下,将本体技术引入IQAS,构建出一个针对《数据结构》课程的领域本体,并以该本体作为语义理解的信息基础,实现了基于语义Web的IQAS。本文系统主要有4个核心模块:1、领域本体构建。采用protege3.1对《数据结构》构建了小型领域本体库,并使用Jena解析本体库持久化至Mysql数据库。2、离线语义推理。为了保证系统实时响应速度,将系统的推理部分作为离线处理并持久化至数据库。3、语法分析模块。将问句进行中文分词和词性标注(分别采用je-analysis中文分词和Viterbi算法),得到一组词语-词性集合,随后通过问句模式匹配划分问句,最后将其转化为查询语句块(QLB)。4、语义相似度计算模块。将QLB和目标查询块(OSB)集合进行问句相似度匹配,问句相似度的精度由词汇相似度决定,词汇包括通用词汇和领域词汇,前者采用基于《知网》的语义相似度算法。针对后者,本文提出了一种基于语义距离和基于上下文加权的概念语义相似度算法,从概念距离、概念的父代和子代三个角度进行计算,在很大程度上加强了领域词汇匹配的精度。通过本文的研究与实践表明,基于语义Web的IQAS可以有效地利用领域本体的信息资源,在一定程度上解决了目前搜索引擎对语义理解不足的问题,并且能够具有较高的准确率。
其他文献
在无人飞行器技术不断发展成熟的今天,无人飞行器不仅应用在军事方面而且在民用领域也有广阔的应用前景。例如,农业喷洒农药、无人飞行器搜救、地理测绘等。四旋翼无人飞行器
目的探讨caspase-3对脑卒中恢复期海马齿状回(dentate gyrus,DG)神经前体细胞(neuronal precursor cells,NPCs)增殖的作用。方法构建小鼠大脑中动脉远端堵塞(distal middle c
氯离子侵蚀导致的钢筋锈蚀造成了巨大的经济损失,严重威胁混凝土结构耐久性。纤维可以有效提高混凝土的耐久性,单一的纤维很难从多方面、多角度提高混凝土的性能,而只有多种
本文在总结国内外公路绿色低碳发展的理论和实践的基础上,按公路在社会经济体系的价值和自然界生态位属性,分析了经济发展转型、生态保护形势严峻等背景下生态高速公路建设的
在我国人口红利逐渐消退、土地资源日益稀缺的背景下,浙江等地区正面临从"资本和劳动力驱动"的县域经济模式向"技术与创新驱动"的都市区经济模式转变的压力,而产业空间的提质
教育活动包括教师、学生、教材、教法、环境等要素。教师和学生作为其中的主要承担者,是教育系统中最基本的要素,而在教育活动中二者结成的关系—师生关系是教育过程中最基本
随着科学技术的迅猛发展,职业岗位进一步分化,更新周期明显缩短,对劳动者的要求也有较大提高,不仅要求劳动者有过硬的专业技能,还要求有高尚的职业道德情操和思想政治素质。
产品形象统一识别系统(Product Identity System,简称PIS)是将企业文化和设计理念融入到产品设计之初,通过对于产品进行系统化规范化的设计来塑造稳定而独特的产品形象,从而
轻型门式刚架结构体系有着用钢量少、外形美观、施工快、造价低、质量轻等优点,目前十分广泛地应用于单层或多层工业厂房中。近年来对门式刚架的研究也越来越多,包括刚架的跨
光伏发电具有发电过程简单,不消耗燃料,无噪声、无污染等众多优点,因此,光伏并网发电成为最有发展前景的新能源发电之一,其规模快速发展,并网容量越来越大。然而,光伏发电受