公共数据中心的ETL系统设计与实现

来源 :计算机应用与软件 | 被引量 : 11次 | 上传用户:mmxxmm333
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
ETL过程是构建数据仓库的重要步骤。大多数现有ETL系统在数据量较大时处理效率偏低。根据ETL在公共数据中心的实际应用改进了原有的ETL结构。鉴于公共数据保密性的特点,设计了数据不同的获取方式;在设置数据转换规则的过程中结合相应领域知识,保证数据质量;前置机之间实行负载均衡,同时把数据转换的不同步骤分配到两台ETL服务器来完成,保证抽取和转换效率。通过实验证明了该ETL系统具有较好的效率。
其他文献
近年来,河南省在推进新型城镇化、工业化和农业现代化的进程中,面临耕地保护与三化协调发展尚未做到统筹兼顾等现实问题,造成耕地保护和利用不充分、耕地非粮化现象加剧,耕地
辽西常见的桑属植物为乡土树种,具备抗逆性强、耐旱、耐寒、耐瘠薄的特性,几种桑属植物更适合于辽西这样年降雨量低、生态环境恶劣的地区大面积栽植,对其综合开发应用,能改善
针对石家庄市地表水源的特点,进行测定分析,以确定有机物分子量分布特性。通过一个水文年的研究结果表明:石家庄地表水源水的共同特性是大分子量(〉10000Dalton)和小分子量(〈300
一、试验目的2016年,按照全国农业技术推广服务中心土壤肥料技术处和河南省土壤肥料站的安排,通过在花生作物上施用“中盐安徽红四方肥业股份有限公司”花生缓释肥料产品,对
在介绍油用牡丹的基本特性及经济价值基础上,分析了焦作市发展油用牡丹产业优势,从品种选择及种子处理、园地选择、栽植时间及播种、定植苗木及修剪、肥水管理、病虫害防治、种
为了能够检测到无线网络系统中已知和未知类型的入侵者,提高无线网络系统的安全性,在对网络数据分析和研究的基础上,提出一种基于免疫算法和反向传播神经元网络的入侵检测方法。首先利用免疫算法对网络数据进行预处理,再运用反向传播神经元网络对处理后的数据(程序)进行识别。实验表明用该方法检测无线网络系统中的新型入侵者是可行、有效的,检测入侵者的准确率可达到97%。
Deep Web数据源的发现和其领域相关性越来越引起人们的关注和兴趣。针对在判别查询接口时,提取精度低和忽略领域相关性的问题,提出一种采用多分类器对Deep Web数据源进行自动分类和判别的方法,其思想是:对爬虫获取到的页面使用朴素贝叶斯分类器对其进行领域相关性分类,然后使用改进的决策树分类器来对特定领域的数据源进行判定。实验结果表明此方法相比于使用单一决策树分类器有更好的性能,其召回率和精度都有
长春花为重要的抗癌药用植物,综述了长春花细胞组织培养中的一些影响其生物量及药用生物碱产量的因素。
介绍了循环流化床锅炉的控制技术,重点介绍了循环硫化床DCS系统的主要改进控制方案。
设备引进作为提高企业竞争力和企业硬件设施水平的一种有效途径,在我国各行各业中发挥着非常重要的作用,同时也是企业自身技术水平和经济实力的一种体现。中国海洋石油海上设