论文部分内容阅读
知识图谱由于其具有的知识高度结构化、应用范围广等优点获得了众多研究人员的关注。基于知识图谱的问答系统作为知识图谱的一大典型应用,目前仍然存在着无法有效表示和利用知识的问题。针对这一问题,本文开展了对知识表示和基于知识图谱的问答推理的研究,并实现了基于实体和关系描述的知识嵌入模型和基于事实记忆和知识图谱的问答模型。其中,基于实体和关系描述的知识嵌入模型用于改善知识的向量表示效果,基于事实记忆和知识图谱的问答模型则用于在知识图谱上推理出问题答案。具体来说,本文的主要研究工作如下:(1)提出并实现了基于实体和关系描述的知识嵌入模型。当前的大多数知识嵌入模型都存在着在三元组的语义信息这一方面考虑过少的问题,针对于这一问题,本文提出了基于实体和关系描述的知识嵌入模型。在该模型中,不仅改进了传统的DKRL模型和TransD模型,在获取实体和关系语义时,也采取了结合注意力机制和卷积神经网络的实体描述嵌入模型和层次化关系语义嵌入模型这两种新方法。实验证明,本模型相比TransE、TransD和DKRL等基线模型,在链接预测中使用bern采样时平均排名达到了最优,且此时的hits@10也达到了最优的77.4%;在三元组分类中采用bern采样时比之前的最优模型(TransD模型)多出了4个千分点。(2)提出并实现了基于事实记忆和知识图谱的问答模型。在现有的基于知识图谱的问答系统中,大多数模型不能同时具有较高准确率和良好的可解释性。针对这一现状,本文提出了基于事实记忆和知识图谱的问答模型。该模型通过对事实记忆网络模型采用双向的三元组信息、多种评分指标和扩展的事实列表这三种方式,在保持了原有的事实记忆网络模型的可解释性的同时也取得了较好的问答效果。相比事实记忆网络等两个基线模型,本模型在WebQuestions上提高了1个千分点,在SimpleQuestions上提高了1.1个百分点。(3)提出并构建了面向知识图谱推理算法的问答系统。该问答系统包含了问题处理模块、数据检索模块和问答模块这三个功能模块,并且在核心的问答模块中,成功地应用了(1)和(2)中的新模型。在实际使用中,本问答系统具有可视化效果较好、准确率较高和可解释性较强等优点。