【摘 要】
:
大数据时代,数据的种类变得多样化,数据规模也日益增大,从这些各种类型的数据中得到较高利用价值的需求变得更为迫切。大数据中所包含的信息没有办法度量,而大数据分析迫切地需要将多种多样的数据源进行统一,使用传统的信息处理方法已经愈发窘迫,不能很好的完成任务。由于数据的结构差异性大、数据的来源广泛,数据中的价值密度不高等特点,对大数据的利用产生了巨大挑战,而多源异构信息融合为大数据环境下进行信息获取、组织
论文部分内容阅读
大数据时代,数据的种类变得多样化,数据规模也日益增大,从这些各种类型的数据中得到较高利用价值的需求变得更为迫切。大数据中所包含的信息没有办法度量,而大数据分析迫切地需要将多种多样的数据源进行统一,使用传统的信息处理方法已经愈发窘迫,不能很好的完成任务。由于数据的结构差异性大、数据的来源广泛,数据中的价值密度不高等特点,对大数据的利用产生了巨大挑战,而多源异构信息融合为大数据环境下进行信息获取、组织和利用提供了一种高效的手段和方法。针对异构信息的融合,构建知识图谱是一种行之有效的手段。本体是共享概念模型的形式化说明,可以对环境领域信息进行形式化描述,这种形式化的描述可以通过自动推理挖掘出隐藏信息。知识图谱通过实体与实体关系的大规模语义网络,把知识变得更具有共享性和高效性。所以,使用基于本体的知识图谱来对环境领域的各项信息进行融合能将各类数据进行整合,进行分析。针对如上问题,本文利用自上而下知识图谱构建理论基础,优化了短文本中三元组的提取,并在环境知识图谱采集展示原型新系统应用。首先,完善了一般知识图谱的构建过程,借助本体建模工具Protégé构建环境信息领域本体;其次,对于文本数据利用句法依存提取方式提取基础三元组,将通用知识图谱和特殊领域知识图谱进行融合,并将图谱数据存入Neo4j图形数据库中,初步构建环境数据领域知识图谱;最后,设计开发了环境知识图谱采集展示系统原型,用以存储和管理环境领域知识。本课题对数据融合和知识图谱进行研究,为异构环境数据信息的采集和管理建立了基础。第一,基于本体建模方法对基础数据类型进行建模,解决部分异构数据融合问题;第二,通过短文本的三元组提取能够将短文本中的信息提取出来,实现文本的信息抽提,解决大文本存储和利用较难的问题;第三,通过将各类环境数据和知识图谱相结合,并利用前端展示技术提供的展示界面,可以直观获得各类环境信息,为环境决策提供决策依据。
其他文献
近年来,随着国际邮轮旅游消费市场东移和“一带一路”国家倡议的实施,沿海各城市纷纷谋求建立国际邮轮旅游城,重视邮轮母港的建设与开发。由于目前仅依靠政府投资建设母港,而母港的开发和运行需要大量的资金才能进行,资金来源渠道单一导致母港的建设受到资金限制与资源局限,发展面临困境。研究城市对邮轮母港竞争力的影响,将城市的发展和母港的开发结合起来,丰富了邮轮母港竞争力的研究理论,既可以帮助邮轮母港优化融资策略
目的本研究应用慢病毒感染技术构建ARID1A基因沉默的人胃癌MGC-803细胞模型,探讨ARID1A基因沉默对人胃癌细胞增殖抑制的影响。方法实验分组:根据Gen Bank数据库提供的ARID1A基因序列,设计3条ARID1A靶点干扰序列,分别命名为KD1、KD2、KD3,阴性对照组(NC)。3条ARID1A靶点干扰序列引物退火形成双链DNA,与经过双酶切的线性化GV493载体连接并转化;在293T
近年来,腔光力系统中光场与机械振子之间的色散耦合机制在量子关联的研究中引起了人们广泛的关注。量子关联诸如量子相干性以及量子纠缠在量子信息和量子计算领域有着十分重要的作用。探究量子相干性,量子纠缠的影响因素,有助于我们在宏观系统实现高且稳定的量子关联。我们在腔光力系统中研究了机械振子的相干性以及机械模与光模之间的量子相干性转移。这个腔光力系统由一个光学腔与两个机械振子构成,并且这两个机械振子以不同的
农民工在我国群体数量庞大,身处社会底层,作为我国工业化进程中的特殊社会群体和城市中新的社会阶层,在国家社会经济发展中扮演着战略性的重要角色,且其数量逐年增加。农民工群体对城市发展贡献巨大,但其社会地位低下,各项权益不能很好的得到保障,处于被边缘化的境地,国家既没有相应的制度安排来提供援助,也缺乏必要的途径来化解,最终结果是维护自身权益的农民工,在维权过程中困难重重,产生冲突行为意向,从而产生冲突行
英语与其他语言一样,通常是以“说”为主要方式进行语言交流。在21世纪各领域信息国际化的时代,英语能力也成为各个专业学生都必须掌握的一个实用技能,特别是英语口语技能。
近年来,全国各地的股权交易中心在融资产品创新、配套制度建设和特色服务等方面实行差异化发展,为资本市场多样化奠定基础。由于我国区域股权交易市场出现时间较晚,对此的研
根据英语课程标准,学生的语言能力由五个方面组成:语言技能,语言知识,学习策略,文化意识和情感态度。但事实上,在初中英语教学中,教师往往忽略后三个方面而过分重视语言技能和语言知识。在学习过程中,教师们往往只要求学生们做个安静的“听众”。换言之,学生们只是教师所传授的知识的被动接收者而非主动索取者。在这种教学模式下,原本应该是趣味横生的英语课也就很自然地变得索然无味了,英语学习的快乐学生们也就无从体会
图像显著区域检测是计算机视觉领域的一个热门研究方向,主要目的是使计算机可以模拟人类视觉注意机制,及时准确的从场景中获取关键信息,进而节约计算机资源。作为图像预处理的主要步骤,显著区域检测算法目前已经广泛应用于图像压缩、目标检测、图像检索、语义分割等领域中。随着深度学习的不断发展,显著区域检测技术已经取得了很大的进步,但是由于自然场景的复杂多变,当前算法仍存在不足。本文在对现有的显著区域检测算法进行
石油工业油气管道运行环境复杂,管道焊缝开裂是其最主要的失效方式之一,管线钢发生的断裂一般均为延性断裂,延性断裂一旦发生,裂纹将会逐步扩展,直到造成灾难性事故。因而开展在役检测管道焊缝裂纹扩展的关键科学问题研究具有重要意义。当管道焊缝存在裂纹缺陷时,在流体冲蚀下,裂纹扩展速度急剧加快,导致漏磁检测时管道焊缝内壁缺陷空间接触面与输送流体之间产生流固耦合作用,并伴随着磁力场的多场耦合问题。在此背景下,本
半潜式起重平台作为海洋结构物拆解吊运作业不可或缺的一员,长期处于复杂恶劣的海洋环境,由于吊运过程中难以避免风、浪、流的作用,还有可能发生的人员操作失误,极易发生跌落事故。因此,研究和评估半潜式起重平台在吊运跌落中的结构安全性具有重要现实意义。本文针对于平台甲板结构跌落事故中的抗冲击性能以及降低这些事故所带来的结构损伤、经济损失及环境破坏等不利后果做了一系列研究。主要研究内容如下:首先,对目前跌落事