基于知识图谱的事实型智能问答方法研究

来源 :吉林大学 | 被引量 : 0次 | 上传用户:ddnihaoba
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
智能问答是指计算机通过分析用户提问,自动回答用户所提出的问题,是一种高级形式的信息服务。知识图谱本质上是一种围绕特定实体所构成的语义关系网络,由实体、概念以及它们之间的关系组成。将知识图谱拥有的丰富且庞大的现实世界知识注入智能问答模型中,将使智能问答模型的表示能力进一步提升,进而在面向事实型问答任务时,无论是用户意图的识别,还是问答中实体的识别都将更为符合现实世界的常识,从而从基础上提升智能问答系统的性能。本文首先介绍了领域知识图谱的构建以及基于知识图谱的智能问答在国内外的技术现状及发展情况。为了对后续问答方法的研究,本文构建了一个汽车领域的知识图谱,介绍了数据获取的过程和知识图谱构建的方法。基于构建的知识图谱,本文研究了基于汽车领域知识图谱的问答方法,提出并实现了一种图匹配方法,同时实现了一种模板匹配方法和一种信息检索方法。其中图匹配方法首先对用户问句进行解析,构建依存树,然后将依存树结构转化为相应的语义图,语义图由节点和关系边构成,可以看作是知识图谱的子图,将语义图同整个知识图谱进行图匹配得到问题答案,完成回答;模板匹配方法预先定义问题模板,当用户输入问句时,根据识别到的触发词及关键信息,寻找用户问题对应的模板,通过槽位填充得到填充后的问题模板,进一步生成图数据库查询语句,在知识图谱中执行得到问题的答案;信息检索方法首先在文本语料库中建立索引,当用户输入问句时,对用户问句进行分词,得到问题中的关键词,根据得到的关键词在索引文件中检索结果,返回匹配程度最高的答案。实验表明,本文实现的方法在回答事实型问题上具有较好的效果。本文还研究了当通过知识图谱无法找到用户问题的答案或当用户输入内容并非提问时,只通过用户输入内容生成答案的方法。具体来说,训练了一个基于深度学习的端到端模型,作为知识图谱问答方法的补充,当用户意图为闲聊或使用前述方法无法找到问题答案时,使用端到端模型基于用户的问句内容生成回答。为了判断用户输入意图,本文训练了一个基于Fast Text模型的文本分类器,对用户输入进行闲聊和汽车领域提问的二分类,根据分类结果调用相应的问答方法进行回答。最后,本文设计了一个基于汽车领域知识图谱的智能问答系统,该系统融合了前文的研究成果,并实现了两种可视化交互界面。
其他文献
推进课程改革几年来,我们结合实际,对临川传统教育文化的继承与发展进行了深入的研究,我们确定推进课改的总体思路是:按照"弘扬临川文化,谋划和谐发展,成就幸福人生"的教育发展理念,确定"一个中心"—以实施素质教育为中心;强调"两个统筹"——城区学校与农村学校的统筹发
期刊
随着计算机技术的不断发展,人类社会中的各个方面开始与之产生紧密联系。人们日常生产生活中产生的海量数据大多以电子化的形式存储在关系型数据库中,在对这些数据进行访问时,往往需要编写SQL(Structured Query Language)来对数据库进行操作。但是,SQL本质上是一种计算机编程语言,编写SQL需要一定的专业知识,此外,还需要了解所访问的数据库模式。通过自然语言来与数据库进行交互查询数据
目的:探讨硬腭粘骨膜、掌长肌腱、鼻唇沟皮瓣这一“三明治结构”在全下睑再造中的可行性。方法:收集2015年至2020年于吉林大学第一医院治疗的因外伤或肿瘤切除导致重度下睑全层缺损行全下睑再造的13例患者的临床资料,对其进行回顾性分析,年龄范围23~61岁,平均年龄为42.2岁,10例为男性(71%),3例为女性(29%),病变部位:左下睑7例,右下睑6例,所有均累及眼睑全层,修复下睑缺损的面积为3c
血栓性疾病,如中风和缺血性心脏病,依然是全球死亡率及致残率最高的疾病。血栓的形成是一个复杂的、动态的、多步骤过程,涉及到生物化学反应、力学刺激、血流动力学等多个方面。近年来,人们已经从这些方面出发做了大量的研究,以期全面地理解血栓的形成机理,更好地预防及治疗此类疾病。然而,无论是从实验、数值还是理论角度,这都存在着巨大的挑战。实验上,受体内测量精确性限制,观察结果的可靠性往往难以保证;数值上,受血
背景:甲基鸟嘌呤-DNA甲基转移酶(MGMT)的高表达是导致胶质瘤对替莫唑胺产生耐药的重要原因。近些年来有研究表明Wnt/β-catenin和NF-κB通路与MGMT介导的替莫唑胺耐药相关。生酮饮食在实验和临床研究中表现出较强的抗胶质瘤作用,但是其对于胶质瘤治疗过程中增强替莫唑胺疗效的研究相对较少。生酮饮食可以调控NF-κB和Akt通路,但是其对于MGMT影响的相关研究较少。目的:探究生酮微环境对
甲骨文是中国最古老的文字体系,它是汉字的起源,也是中华民族优秀传统文化的根。甲骨文识别的任务是确定甲骨文的字符类别,它是完成甲骨文释读的必要前提条件。目前,对拓片上的甲骨文进行自动文字识别工作主要依赖专家的特征工程。工作内容复杂且工作量大,需要大量的人工成本和时间成本。所以对甲骨文进行自动图像识别具有重要研究价值。目前卷积神经网络在图像识别域已经取得了很大的成果。本文利用卷积神经网络中的ResNe
国内外经济环境的不断变化加剧了国内企业之间的竞争,如何提升企业核心竞争力是所有企业所面临的关键问题。从企业财务的视角而言,财务管理贯穿企业经营中的所有主要经济活动,建立完备的财务内部控制体系是企业竞争力的重要保障,具有举足轻重的意义。电力行业是国家重要能源产业之一,关乎国家经济发展、工业发展及民生等多项重要领域,电力行业的行业封闭性使供电公司在财务内部控制方面存在很多隐患。本文以蓝天供电公司作为研
互联网的普及促进了复杂网络的发展,如何学习一个低维稠密的向量来表征复杂网络中的节点以便进行分析成为了一个研究重点。变分图自编码器凭借其强大的生成能力已经成为复杂网络表征的常用方法之一。然而目前变分图自编码器的研究存在两个挑战。1)已有的变分(图)自编码器及其变体大都假设隐变量服从标准正态先验或服从一个融入了很多专家经验的复杂先验,但是在很多实际情况中很难确定采用什么形式的先验或者先验概率很难获取。
传感技术的迅猛发展使得图像成像系统逐渐完善,得到的图像信息呈爆炸式增长。这些信息之间既有互补性,又存在较大的冗余性。图像融合技术可以将多幅图像由不同类型传感器或同一类型传感器的互补信息融合至一幅图像上,并在消除冗余信息后,生成一幅新的图像。融合后的图像能够弥补单一图像的不足,并且可以提高图像信息的利用率,获得更加丰富且精确的信息,同时借助获取的信息来生成高质量的图像。图像融合技术已经被广泛地应用在
在我国,现如今胃癌已经成为第三大癌症,并且每年都会有40万人左右深受胃癌所带来的伤害。目前,在临床上对胃癌进行诊断的常用手段之一就是内窥镜检查。胃癌在发病时较为隐匿、不易被患者所察觉,早期经常会因为没有明显的症状而导致漏诊的情况出现,并且还具备易转移、复发和预后差等特点。据研究表明,内窥镜检查可以显著的减少亚洲患者胃癌死亡率。在检查过程中产生的大量内窥镜图片需要由专业的内科医务人员去进行初步筛选,