【摘 要】
:
在大数据时代,为了高效利用海量的互联网数据,国内外互联网公司纷纷以此为基础构建知识图谱,知识图谱以其强大的知识组织能力和语义处理能力在智能问答、语义推荐、舆情分析
论文部分内容阅读
在大数据时代,为了高效利用海量的互联网数据,国内外互联网公司纷纷以此为基础构建知识图谱,知识图谱以其强大的知识组织能力和语义处理能力在智能问答、语义推荐、舆情分析等众多领域发挥着重要作用。但是目前针对政府大数据应用领域的知识图谱非常匮乏,并且公开的许多研究都孤立的强调图谱构建过程中的某一环节。针对以上问题,本文主要面向政府的企业大数据领域,提出了基于多数据源的知识图谱构建方法,并基于此方法从知识抽取,知识融合、知识加工三个方面完整阐述了企业法人知识图谱的构建过程。首先,本文以部分官方的企业数据集为基础,构建爬虫系统融合百度百科网页数据源。针对企业相关的多源数据集进行分析和整理,抽取出其中主要的类、对象属性和数据属性,构建企业法人本体为知识图谱提供上层的数据模式。第二,通过引入本体来解决多数据源集成时遇到的语义异构问题,针对多源异构的企业数据集进行Karma建模,利用Karma模型来描述本体中概念与数据之间的语义映射并完成多数据源的快速集成,发布统一的RDF数据和R2RML模型。第三,针对多数据源集成后统一的RDF数据,基于Jena推理引擎完成对RDF中隐含知识的挖掘和知识的修正,主要包括了规则推理、上下位推理、缺失类别补全和知识的一致性检测等方面。第四,针对知识图谱的存储和可视化问题。本文设计了基于图数据库Neo4j的RDF数据存储方案,通过构建RDF2Neo4j解释器对RDF的三元组数据进行解析存储。最后,本文基于Spring Data框架构建了企业法人知识图谱应用系统,实现对知识图谱的检索和应用。本文以政府提供的企业数据集和百度百科为主要数据源,从多源异构数据集成的角度详细阐述了构建企业法人知识图谱的主要流程,并实现了企业法人知识图谱的可视化系统。用户和开发者可以通过功能丰富的应用界面,方便和透明地使用和维护知识图谱,对政府部门基础数据的应用和公开具有重要意义。
其他文献
对于历史数据不完整的风电机组系统,运行过程中需要对系统和设备进行实时可靠性分析和预测。以风电机组主轴轴承系统为例,以参数偏差为其量化指标,建立实时的可靠性评价模型,
<正>小麦的传统加工主要是制粉(如面粉),制粉只是小麦的粗加工,在制粉过程中产生面粉、麸皮、麦胚芽等产品。这些产品被广
【摘 要】本文分析高职院校创新创业师资队伍建设中顶层设计不完善、定位模糊、数量不足、结构不合理、权责不清、考核和评定标准不明确、缺乏可持续性培养等问题,提出具体的对策:加强制度建设,为“双创”师资发展提供配套保障;找准定位,增强高职院校“双创”教师创新精神与意识;拓宽“双创”师资队伍聘任渠道,逐步优化教师结构,提升师资队伍稳定性;进一步修订完善相关考评机制,加大激励,调动“双创”教师积极性;和企业
本文阐述了锦灯笼规范化种植的关键性技术,并从营养价值和药用价值两方面说明了对其开发利用的情况,为规范锦灯笼的生产技术和资源的开发利用提供参考。
本文系统研究了杨梅单宁改性后和聚铝复合絮凝剂对活性印染废水的脱色处理,测定了最佳物料质量比,投加量等。在最佳条件下色度去除率可达99%。
江苏省苏州中学副校长黄厚江在《中学语文教学》2019年第2期上撰文认为,小群文阅读是主题具体集中、组文篇幅短小、阅读量适度控制、阅读周期较短的一种群文阅读,主要有三种组群方式:一是完全教材内文本的群文,即以教材為范畴围绕一定主题跨年段跨年级对教材文本进行重组而建立的课内阅读群文,如教材中有几首边塞诗,可以进行“教材中的边塞诗阅读”;二是由内而外的“1+x”组群,即以课内某一篇文本或某一单元的文本为
本研究的目的是评价性别不同时是否对颜色的辨别存在影响。本文将以NCS色谱中选择的40个色相不同的色块色轮图为研究对象,根据颜色科学和心理物理学相关实验,建立其与APP特级
智能电网所产生的大量数据使得传统的智能电网数据管理系统无法为数据的聚合和分析提供足够的存储和处理能力。为了解决这些问题,文中提出了一种基于lambda架构的能够对海量
以菘蓝种子为试验材料,采用不同浓度的PEG-6000溶液模拟干旱胁迫,研究了三种处理方法即ABT浸种﹑CaCl2浸种﹑吸湿回干以及对照对菘蓝种子抗旱性的影响。结果表明:对照组中,在5%PEG