【摘 要】
:
数据集成环节,越来越丰富的异构源数据给集成后数据质量的提升带来了新的挑战和困难。针对传统ETL模型在数据集成后出现的数据冗余、无效、重复、缺失、不一致、错误值及格式
【机 构】
:
大规模流数据集成与分析技术北京市重点实验室,北方工业大学云计算研究中心
【基金项目】
:
国家自然科学基金重点项目(61832004).
论文部分内容阅读
数据集成环节,越来越丰富的异构源数据给集成后数据质量的提升带来了新的挑战和困难。针对传统ETL模型在数据集成后出现的数据冗余、无效、重复、缺失、不一致、错误值及格式出错等数据质量问题,提出了基于元数据模型控制的ETL集成模型,并对数据集成过程中的各种映射规则进行了详细的定义,通过将抽取、转换、加载环节的元模型和映射机制相结合,能够有效地保证集成后数据的数据质量。提出的元模型已经应用到科技资源管理数据集成业务中。通过科技资源管理数据集成实例分析,验证了此数据集成方案能够有效地支撑大数据环境下数据仓库的构建和
其他文献
目前,我国电子商务呈高速增长态势,主要表现在交易额日益上升、模式创新日益活跃、环境日益改善。电子商务的高速发展使得快递业业务量不断上升,业务范围得到不断扩展,促使快
文章分析了中职机械制图课程教学的现状,并在实践中探索关于信息技术与机械制图教学两者之间的融合,旨在利用信息化教学手段提高中职机械制图课程的教学效率,培养中职学生成
在时代的发展过程中,人们在满足平时的衣食住行之外逐步丰富自身的文化生活,产生了多种多样的艺术形式,这些艺术形式是人类的精神结晶。舞蹈和音乐,都是艺术的表现形式,他们
过渡流区气动问题的数值模拟一直是空气动力学领域的难点。首先介绍了在已有N-S解算器和DSMC方法研究基础上,采用MPC耦合技术建立N-S/DSMC耦合算法,把DSMC方法和N-S方法的应
现代教育改革的核心是使学生变被动型学习为主动的投入型学习,让他们在真实的环境中学习和接受挑战性的学习任务。在体育教学中如何“发挥学生的主体作用”是体育教学落实素
在小学音乐教学活动中,怎样培养学生的学习兴趣,使学生乐于学习音乐呢?下面我谈几点浅见。
中国人工智能研究领域的不断深化,人工智能的发展释放了大量劳动力,也降低了对工作的强度和工作量的需求。动商作为人类个体发展的重要指标,随着人工智能的发展应该发挥更大