商品比价系统中大数据迁移及数据转换技术研究

来源 :北京邮电大学 | 被引量 : 4次 | 上传用户:zhz_8512
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着因特网的迅猛发展,人类已进入信息高速发展时代。各式各样的互联网应用,都在经历爆炸式的发展,产生海量数据。从19世纪70年代开始,关系型数据库(RDBMS)几乎统治了数据管理场景。但是当业务不断扩大,存储和处理的数据量也不断增长,关系型数据库越来越难以扩展,在查询性能上也越来越差。在某些用户访问量频繁、并发性高的网络应用中,对承受巨大负荷的数据库层提出了更高的性能和扩展要求,传统的关系型数据库面对这一需求事越来越显得力不从心。NoSQL数据库凭借其良好的扩展性和处理大数据量时的高性能表现,已经走在了大数据存储系统改革的前沿,逐渐成为新的持久化存储备选方案。HBase是近年来商业化应用较多的NoSQL数据库,是一个能够提供实时、随机读写,能够存储数十亿行和数百万列的数据库。它设计是要运行于一个商业服务器的集群之上,当新服务器添加之后能够自动扩展,还能保证同样的性能。随着其被Facebook等知名互联网公司成功用于构建实时系统,已经成为了当前最热门的NoSQL数据库之一。本文即是以分布式数据库HBase为基础,针对实际应用中大数据量迁移转换需求,探讨了在海量数据背景下将数据库从关系型数据库向HBase迁移的方案。本文在研究了数据库基本理论和部分经典数据迁移方法及策略后,决定采用基于XML的中间件方案来设计开发该数据库迁移系统。本文主要工作包括:1)针对目前关系型数据库到HBase数据库迁移存在种种问题,提出了一种基于XML的一种有效的从关系型数据库到HBase数据迁移和数据模式转换方案。2)详细介绍了本数据库迁移中间件的设计与实现。3)应用于商品比价系统中,成功地将历史数据从RDBMS迁移到HBase中。
其他文献
目的通过对尘螨、霉菌及花粉变应原结膜激发试验(CPT)的结果分析,探讨变应原种类对结膜激发试验结果的影响。方法选择2008年至2009年符合变应性鼻炎、结膜炎和(或)支气管哮喘诊断
我国2005年修订的《公司法》虽然设立专章对有限责任公司的股权转让问题予以规制,但在实践操作中,基于股权转让产生的纠纷层出不穷,相关案件的审理也是司法裁判的难点。究其
针对W波段波导缝隙天线加工难度高、加工后缝隙尺寸不易修改的问题,提出了一种改进型缝隙电导函数提取方法.首先,根据工艺可实现性,设定合理的波导辐射面壁厚和缝隙宽度;然后
【正】1 前言气相法白炭黑(学名气相二氧化硅)是利用氯硅烷经氢氧焰高温水解制得的一种精细、特殊的无定形粉体材料,平均原生粒径约为7-40纳米,聚集体粒径约为200-300纳米,
近年来,随着社会主义新农村建设的深入开展,各级政府不断加大对农村饮水安全工程建设的资金投入。为了解秦皇岛市农村饮水安全工程水质卫生现状,为政府制定相关政策提供科学
血液应用于临床已有百年历史,虽然现代医学水平不断提高,但至今血液作为临床抢救危重病患有着不可替代的作用,随着医院每年用血量的不断增加,血站作为临床供血的唯一机构,所
[摘 要] 自然资源资产和负债的核算是编报的核心工作,实物量的核算比价值量的核算简单,负债的价值量核算比资产的价值量核算更为复杂,所以文章选取资产和负债的价值化核算作为研究方向,并重点研究负债的核算问题。资产和负债都采用双重核算的方式,在实物化核算的基础上,着重研究其价值化核算方法,根据价格的公允性和成本效益原则,采用逐步退而求其次的方法确定定价方法。针对资源、环境和生态三个层次的负债,采用分类