ETL技术在期货CRM系统中的应用研究

来源 :考试周刊 | 被引量 : 0次 | 上传用户:JackCF1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘 要:对于CRM系统而言,最重要的是全面丰富准确的客户数据,在数据中心建设过程中ETL技术和数据库技术是关键的两个方面。作者以自己参加的期货CRM项目为依托,阐述了期货CRM数据中心建设及ETL系统设计,对ETL技术的研究,ETL系统的设计和实现是本文研究的重点。
  关键词:ETL技术 期货CRM 数据中心 规划与设计 数据库
  
  1. ETL技术
  ETL是将分布的、异构数据源中的业务数据经过抽取、转换、清洗后装载到数据仓库的过程。
  典型的ETL工具具备数据抽取、数据转换、数据加载、元数据管理、数据质量保证、调度与监控、异常错误管理等功能。数据抽取是从多种异构数据源获取符合需求的数据过程,在一个ETL系统中,最起码包括全量数据抽取、增量数据抽取两种抽取模式;数据清洗与转换从数据源中抽取的数据不一定能完全满足目的库的要求,可能存在数据格式不一致、数据不完整、字段含义不一致、空值等问题,并且还需对数据进行聚合、汇总、统计等操作,数据清洗和转换过程是按照预先设计好的规则对抽取的数据进行处理并消除冗余、歧义、不完整、违反业务规则的数据,以满足目标数据的数据模型和数据质量的要求;数据加载是ETL流程的最后一个步骤,即将转换完的数据按照目标数据模型定义的表结构加载到目标数据库系统中。
  2.期货CRM
  期货CRM是指以客户为中心,恰当地提供期货产品和服务,提高客户的满意度,最大限度地减少客户流失,实现客户和期货公司的双赢。应用上主要实现客户关系管理、客户服务管理、市场营销管理、居间人管理及相关数据统计分析等,主要的业务需求:整合客户资源、客户分析与管理、统一营销管理、整合资讯和研报。
  3.数据中心
  CRM最关注的是客户数据,只有丰富全面的数据才能反映客户的需求。数据中心建设是CRM的基础关键所在,作为数据中心,其在整个信息化体系中,主要发挥以下作用:将传统以业务为导向的数据,加以采集、清洗、转换,成为以客户为导向的数据组织;形成以客户为中心的数据档案形式;为后台提供多形式的应用服务;为统计分析、数据挖掘提供基础支撑。
  数据中心系统结构分为ETL、中心数据库、数据服务及管理程序四个子系统。ETL模块主要负责数据的抽取、清洗和转换,是数据中心建设的基础,该模块采用自主研发的ETL系统实现。中心数据库用于存放经过数据抽取系统清洗转换后的数据,并作为数据服务系统的数据来源。中心数据库需要满足对海量数据、高性能、高可用性和扩展性的支持,本项目采用ORACLE RAC数据库系统。数据服务采用主动推送和服务访问两种方式互相结合,对外围业务系统提供数据支持。管理程序对系统中涉及的各个应用程序进行统一的状态监控、统一的日志查询,同时用于管理数据中心的历史数据,数据库的日常备份等。
  4. ETL规划与设计
  根据金融期货数据中心的特点,本项目ETL系统采用自主研发形式实现,整个ETL由采集AR、采集AS、数据抽取组件、数据转换组件、数据采集服务器组成。ETL体系结构如下。
  (1)采集流程。ETL系统支持多个抽取程序并发处理,数据采集服务器向采集AR发出采集命令,采集AR再将采集命令路由到采集AS,由采集AS完成相应数据源的数据抽取工作,并将数据传送到数据采集服务,这些数据经数据采集程序清洗转换最终将数据存放在数据中心,以方便其他系统使用。
  (2)数据抽取模式。系统支持实时、日终和历史三种抽取模式:实时数据抽取是指主要用于实时监控功能;日终数据抽取是指抽取清算后的数据信息;历史数据抽取是指将数据源中指定日期的历史数据抽取到数据中心。
  (3)数据清洗转换。数据转换的任务主要进行不一致数据的转换,数据粒度的转换,以及一些业务规则的计算,如空值处理,数据类型不一致处理,将细粒度数据聚合成粗粒度数据,业务规则计算,等等。系统数据清洗转换通过两种方式实现:采集程序在数据采集过程中通过转换规则进行数据转换,并将转换的数据加载到数据中心;通过单独的转换组件对数据中心的数据进行统计、汇总。
  (4)数据加载。将转换完的数据按照目标数据模型定义的表结构加载到目标数据库系统中。本ETL系统采用实时增量抽取模式和日终数据抽取和历史数据抽取模式两种数据加载方式。
  (5)并发与负载均衡。为了提高ETL性能,系统具备并行处理能力,系统通过采集AS、采集AR、采集服务器的n∶1∶1的组合方式实现并行和负载均衡,同时也实现了分布式抽取的功能。
  (6)数据质量保证。本ETL系统通过以下几种方式保证数据的准确性和完整性:系统通过核对数据源端和数据中心端的记录数,相关字段的汇总值,生成核对报告,以保证数据采集的一致完整性;数据中心的数据表上增加了数据库规则的检查,保证主键唯一、实体完整、字段非空;通过异常处理模块,从另一个角度保证数据质量。
  5.结语
  建设一个高效CRM系统,最为关键的是通过建设数据中心,将分散在各个系统中的客户数据进行整合和汇总,为CRM系统提供统一的客户视图,本文是基于期货公司CRM系统数据中心的设计与实现基础上完成的,介绍了期货公司数据中心建设过程,并对ETL过程进行了重点研究。
  目前,本ETL系统在期货数据中心生产环境稳定运行,但随着期货行业的发展,数据量快速增加,实时性要求越来越高,开发一个能支撑海量数据、高吞吐量和响应时间的ETL系统是行业发展的必然要求。
  
  参考文献
  [1]W.H.Inmon.王志海,林友芳等译.数据仓库(原书第四版)[M].北京:机械工业出版社,2006.8.
  [2]Ralph Kimball著.唐富年,孙媛媛译.数据仓库生命周期工具箱(第二版)[M].北京:清华大学出版社,2009.9.
  [3]PHILIP Russom.操作型数据仓库——操作型应用和数据仓库之间整合[M].TTNN Group,2010.6.
其他文献
一、采种。选择结实多、长势壮、无病虫害、品种优良的中年母树采种。当果实外皮呈紫红色,内种皮变蓝黑色时,采集籽粒饱满、色黑油亮、富有光泽的优质种子。采集后放于阴凉
本研究采用虎红平板凝集试验和OIE标准间接酶联免疫吸附试验初筛,试管凝集试验复核,对我国部分省市进行了犬布氏杆菌病血清学流行病学调查。共检测的4750份犬血清中60份为阳
猪链球菌病主要由猪链球菌(Streptococcus suis,SS)引起,可致急性死亡、急性败血症、脑膜炎等。SS根据其荚膜多糖抗原的差异可分为35个血清型,其中猪链球菌2型(SS2)毒力最强、流行
水稻旱植一是旱地套栽旱稻,二是望天田耐旱栽培。经多年生产实践现采取有水水栽,无水旱栽;有水水管,无水旱管;以及增窝增苗等配套技术,一般亩产可比同等水栽老秧增产50~75公
"生命不保,谈何教育"。长期以来,安全事故在各级各类学校中时有发生,各级教育部门对安全问题也极为重视,安全教育成了学校教育的重中之重。俗话说"预则立,不预则废",说明凡事先有
摘 要:为使思想品德课的评价既满足智育的评定要求,又满足德育的评定要求,更满足学生行为表现和道德实践能力的评定要求,作者从终结性评价与形成性评价相结合、他人评价与自我评价相结合和定量评价与定性评价相结合三个方面进行了探索的实践。  关键词:初中思想品德课 教学评价 人文素养    初中思想品德课既要对中学生进行心理、法律、国家常识教育,又要对学生进行思想道德素质和行为规范的培养。与此相适应,思想品
从事信息技术教学工作十五年,我亲身感受和体验了江苏新课程改革,应该说以学生为主体的新课程体系使学生在新的学习方式下不但学到了许多实用的知识,而且减轻了学习负担和心理压力。作为一名高中信息学科的教师,我深感当前高中信息技术课堂教学正面临着从内在理念到外在方法的改变。新课改为了培养和提升学生的信息素养、创新精神和实践能力,要求信息技术学科教师在教学中有效地探索与实践,及时总结经验,走出误区,形成一种高
在椭球体放矿理论的研究中提出了不同的崩落矿岩移动方程。移动方程可以将移动范围内的崩落矿岩颗粒点位移定量的表达出来,以它为数学模型,建立数值模拟理论体系,借助计算机
摘 要:当今社会急剧转型,道德滑坡,各种不良思潮日渐汹涌,广大青年特别是大学生接受传统文化的熏陶甚少,传统文化根基缺失,导致学生思想道德修养现状令人担忧。将中国传统文化与大学生思想政治教育相结合,辅以校园文化、课程改革、社会实践等宣传途径,将会对大学生的思想政治教育起到良好的助推作用。  关键词:传统文化 大学生 思想政治教育 具体应用    人类社会的文化教育是社会发展的决因素。没有文化的传承就
3月23日,首都女记协和民族团结杂志社在京联合召开少数民族女新闻工作者座谈会,新华社、人民日报、中央电视台、中国国际广播电台、北京电视台、中国妇女报、民族画报社等单