基于大数据的元模型及数据保障研究

来源 :粘接 | 被引量 : 0次 | 上传用户:qt393761474
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对海量的数据资源管理效率与质量问题,提出一种基于Hadoop的元数据管理模型。在该模型中,采用Hadoop对元模型进行搭建,从而完成对整个元数据的储存;然后通过ETL工具,通过分布式抽取的方式,实现对不同服务集群中化工类数据库数据的抽取,并通过ETL抽取、转换、加载和映射,建立映射规则,进而将不同的数据存储到对应的数据库中。最后,以某化工类数据库中的元数据抽取为例,通过对比数据集成率和数据可用性,看出本研究方案可提升海量数据下的数据有用率和集成率,对保障元数据的抽取质量具有借鉴价值。
其他文献
目的探讨基于5A模式的早期心脏康复护理在急性心肌梗死(AMI)行经皮冠状动脉介入术(PCI)患者中的应用效果。方法按住院时间先后将诊断为AMI并急诊行PCI治疗的88例患者分为对照
目的:观察超声骨刀应用在腰椎手术中的临床效果。方法:选取在笔者所在医院2016年12月-2017年12月进行腰椎手术的50例患者为研究对象。依据抽签法完成每组的分配,研究组(n=26)
目的探讨放射性碘125粒子植入联合射频消融(radio frequency ablation,RFA)治疗脊柱转移瘤患者的效果。方法选取2017年1月—2019年12月收治的294例脊柱转移瘤患者,根据治疗方