【摘 要】
:
随着信息技术的快速发展,带有海量实体和关联关系信息的数据大量出现。图数据模型因其强大的表达能力,被广泛用于此类具有关联语义的数据建模中,称为信息网络。信息网络中用节点表示实体,用边表示实体间的关系,网络中的实体和关系可以是同质或异质的,异质信息网络包含更丰富的语义信息。对异质信息网络进行多维度、多层次的分析,可以挖掘潜在的有用知识。早期信息网络多维分析技术大多面向同质信息网络,且对实体间关系的分析
论文部分内容阅读
随着信息技术的快速发展,带有海量实体和关联关系信息的数据大量出现。图数据模型因其强大的表达能力,被广泛用于此类具有关联语义的数据建模中,称为信息网络。信息网络中用节点表示实体,用边表示实体间的关系,网络中的实体和关系可以是同质或异质的,异质信息网络包含更丰富的语义信息。对异质信息网络进行多维度、多层次的分析,可以挖掘潜在的有用知识。早期信息网络多维分析技术大多面向同质信息网络,且对实体间关系的分析较为简单,难以满足用户的复杂查询需求。本文主要针对大规模异质信息网络的多维分析技术展开研究,工作内容描述如下:1.提出了一种具有两层结构的图立方体模型HiCube。使用结构维和属性维作为异质信息网络多维分析的维度,分别从网络拓扑结构、节点和边本身的角度查看数据,提出了相应的结构维聚合图和属性维聚合图作为分析的度量;提出了两层图立方体模型HiCube对聚合图进行管理,第一层是结构维图立方体,每个子立方体维护一个第二层立方体,属性维图立方体;具体定义了图立方体的层次结构;基于HiCube模型定义了上卷与下钻操作,以支持用户对异质信息网络进行多维度、多层次的分析。2.基于HiCube模型提出了相应的物化策略及查询算法。通过分析用户多维分析需求,针对结构维立方体和属性维立方体提出了不同的物化策略,并基于物化的立方体提出了相应的查询算法。通过实验验证了物化策略和查询算法的有效性与高效性。3.设计并实现了一个异质信息网络多维分析系统。为了支持现实应用中大规模异质信息网络的多维分析查询,基于分布式存储平台HDFS和并行计算框架Spark,设计并实现了一个多维分析系统。该系统利用异质信息网查询语言描述用户多维分析需求,并以可视化的形式呈现聚合图。通过在系统中进行现实场景下信息网络多维分析测试,验证了系统的有效性。
其他文献
本文主要研究不同铸造方式下(玻璃管吸铸、金属型铸造和砂型铸造)过共晶A390合金硅相共晶凝固离异化行为,并探究了过共晶Al-Si合金中合金元素对共晶凝固离异化行为的影响。不同铸造方式下,过共晶A390合金经不同熔体处理后(720℃-560℃区间不同温度下保温10分钟)硅相共晶凝固离异化行为差异很大。玻璃管吸铸能使所有熔体处理后(除560℃熔体处理外)的合金的共晶凝固完全离异化,在650℃保温10m
在我国民众的饮食结构中,猪肉扮演重要角色,猪肉产量和消费量占比非常高。但近年来我国猪肉安全问题层出不穷,严重影响了消费者对于猪肉制品的消费信心。消费者的信任感缺失及猪肉质量安全的重要性都要求着我们建立可靠高效的溯源体系。本研究以区块链技术、供应链理论和溯源理论为指导,首先利用文献研究与实地考察的方法,对我国现有的冷鲜猪肉供应链的具体业务流程开展调研,挖掘当前的冷鲜猪肉溯源存在的问题以及分析供应链上
战略性物流产业是一国经济活动所需关键资源、产品等时空流动的保证,是国家经济发展的重要支撑产业,实现战略性物流产业价值链的自主可控,是当前我国产业安全的迫切需求。因此,本文研究战略性物流产业价值链自主可控评价及优化问题,具有重要现实意义和应用价值。本文在系统综述战略性物流产业价值链自主可控国内外相关研究的基础上,基于权力观界定了战略性物流产业价值链自主可控概念,在此基础上,从资源权力、关系权力和制度
微型燃气轮机是新世纪以来能源动力领域内的重要设备,对微型燃气轮机进行技术研究于国家发展而言存在广阔的应用前景。微型燃气轮机是目前最为成熟、最具商业竞争能力的小型分布式发电动力装置,此类发电方式能够增加电网机动性,改善电力质量,降低送电损失。分布式发电系统的发展为微型燃气轮机技术的深入研究以及市场应用提供了良好平台,它是一种充满前景的节能环保型供电方式。在热电联产领域,微型燃气轮机可与内燃机直接竞争