面向中文知识图谱构建中的知识推理方法研究

来源 :国防科学技术大学 | 被引量 : 0次 | 上传用户:mchz
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网和人工智能技术的发展,对知识以及及知识间的关系逐渐得到重视。互联网已从超链的文档万维网转变成为了包含实体间大量关系的数据万维网,其包含了实体间丰富关系的语义网络,称为知识图谱(Knowledge Graph),被认为是未来搜索引擎的核心。各搜索公司如Google、百度和搜狗等纷纷展开知识图谱的研究,以提高搜索质量。目前主流的知识图谱,诸如Freebase,DBpedia,NELL等,虽包含了上亿条事实数据,但尚存在不足,如在自动构建知识图谱的过程中,实体与实体之间存在许多潜在未知关系,并未完全标识出。因此,基于知识推理算法,自动推理出实体间的关联关系来补全知识图谱,构建一个相对完整的知识图谱,在语义搜索,人工智能,商业决策等方面具有重要意义。本文针对目前基于图的知识推理算法存在的路径连通性问题和计算开销大的问题,进行了改进,主要工作包括:(1)对当前主流的知识图谱以及相关知识进行了分析介绍,在研究了国内外知识推理的研究现状的基础上,综述了知识图谱构建及推理涉及的关键技术,并指出了当前研究中存在的问题和挑战。(2)提出了一种基于特征词集合进行路径补全的优化方法。在基于图的游走过程中,由于知识图谱中实体间的关系缺失导致实体之间路径不连通,从而无法搜索到有效路径。本方法充分利用实体的描述文本信息,利用TF-IDF算法提取实体的特征词集合来补充路径缺失信息,较好的解决了路径连通性问题。实验结果表明,本方法提高了模型推理的精确度。(3)提出了一种利用上位词划分实体领域的路径约束游走剪枝的方法。由于知识图谱中的路径数量庞大,每步游走将导致路径数量呈指数级增长,为减少路径搜索的量级,本方法针对图上游走的路径发现策略进行了改进。基于百科分类体系构建包含层级分类结构的上位词表,通过word2vec训练词向量,计算字符串相语义相似度,对知识图谱中的实体进行领域划分,通过仅对相关领域内的实体节点进行游走,大大减少了条件约束下的路径数量类型。实验结果表明,本方法有效提高了计算性能。
其他文献
[目的]引入膳食质量指数(DQI)评价并改善浦东新区小学生膳食模式,为探讨改善小学生营养状况的方法提供依据。[方法]抽取浦东新区城区和乡镇地区小学各2所小学生1493人,按所在
[目的]本课题以清热解毒名方黄连解毒汤为实验对象,对比研究传统饮片汤剂和配方颗粒汤剂中主要成分的药动学行为。探讨中药配方颗粒在中药复方配伍中应用的可行性,为中药配方
干细胞移植为近年来心血管领域研究的热点之一。脐血干细胞在自我更新、增殖分化和体外扩增等方面的潜能,明显优于骨髓干细胞和外周血干细胞,有可能成为未来细胞移植的重要供
电影名称的翻译是进口电影在国内能否获得成功的关键,一个好的翻译可以使电影更完美和更具有吸引力。本文主要论述了对于进口电影名称的翻译方法。
软件无线电是20世纪末提出的一种新的设计思想,它突破了传统的无线电台以硬件为核心的设计模式。其中心思想是构建一个开放的、标准的、模块化的通信硬件平台,用软件的方式来
2010年11月16日,最高人民法院公布了《关于适用<中华人民共和国婚姻法>若干问题的解释(三)(征求意见稿)》(下称"草案")。该征求意见稿内容涉及房产分割、亲子关系、生育权,"
学校侵权补充责任指学校、幼儿园等教育机构对于第三人造成其管理下的未成年学生的损害,由于违反教育、管理、保护义务而承担的直接责任人所能够承担的赔偿责任份额之外的补
安全培训可以提高从业人员的安全意识,提高安全知识,增强安全技能,有效的改变安全习惯,从根本上预防事故的发生。由于我国的安全培训工作起步较晚,尚处于一个需要不断完善的
2017年9月15日,李惠军老师在江苏省宜兴中学以"追寻秦始皇"为题开了一节示范课。该课以囊括时空格局的历史背景勾勒、回归"人性",以渗透学术研究的历史人物钩沉,以发展学生核