全国土地确权登记报送系统的架构优化设计与实现

来源 :北京邮电大学 | 被引量 : 2次 | 上传用户:hobbysh
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网技术的高速发展,各行各业都已经进入了大数据时代,人们产生和需要处理的数据量越来越大。这些数据只是信息的载体,具有多态、异构、海量、多样等特性,如何从这些海量数据中挖掘出具有潜在意义的信息,为企业的进一步决策提供参考价值,是近年来各行各业关心的话题。目前,全国土地确权登记报送系统已经上线并稳定运行,并且积累了大量的土地承包经营权确权登记颁证工作方面的数据。其中包括全国共27个省(自治区)、344个市(直辖市)和2859个县(区)的用户信息以及数据信息,每个报表信息当中各县(区)提交了不少于42项的信息数据,省市级用户需要统计不少于38项的信息数据,数据以134176条记录/月增长,以536704条记录/季度增长,一年仅报表数据可产生2146816条记录,此外还有每年各级用户提交的基础信息数据。随着数据规模的增大,以及后续功能的不断扩充,该系统的并发处理性以及大规模数据的分析能力将急剧下降,现有系统无法满足系统的拓展性要求。基于上述问题的出发点,本文对海量数据处理相关的技术进行了研究,在对数据仓库技术、分布式存储与计算等关键技术的研究基础上,结合全国土地确权登记报送系统的业务需求,对现有系统进行了海量数据处理的架构优化设计。论文的主要工作和研究成果如下:一、根据农业部的业务需求,设计了一种基于数据分析主题的数据仓库,通过数据仓库的维度模型,结合数据仓库的ETL技术,实现了全国土地确权登记报送系统的业务数据库到数据仓库的抽取、清洗、转换以及转载的过程,为农业部门进行海量数据分析提供了第一手的决策支持方案,减少了使用旧数据带来的决策无效和决策干扰的风险。二、利用Hadoop的分布式文件系统进行了分布式集群环境的搭建,并且利用Sqoop技术实现了数据仓库与分布式文件系统之间的数据传输,通过廉价的硬件设备分布式存储文件,解决了现有系统随着功能不断扩充而出现的海量数据存储问题,并为后续分布式计算模型奠定基础。三、本文结合对Hadoop的分布式计算模型MapReduce的研究以及全国土地确权登记报送系统的数据分析需求和软硬件实力,设计了一种有效的基于分布式的计算模型对系统的并行处理能力进行优化,对MapReduce的mapper和reducer过程进行了详细的自定义设计,在各分布式服务器上进行关联匹配,然后将各个服务器的数据计算结果合成得到最终结果,这种设计有利于减轻了网络频繁的通信负担,相比原有系统具有并行计算、异步处理的优势,大大提高的系统处理数据的速度。
其他文献
随着消费者营养和保健意识的增强,特别是运输技术和蔬菜采后处理技术的提高,世界蔬菜贸易持续增长,并且发生着一些实质性的变化.本文详细探讨了国际蔬菜市场的基本格局和动态
长期以来,中国经济的各个行业(包括建筑业)始终保持着快速增长,取得了举世瞩目的成就。然而,高的增长速度并不代表着高的效率,高的增长速度可能是由投入的大幅度增加所提供的
垂直外腔面发射半导体激光器(vertical external cavity surface emitting laser, VECSEL)兼具高功率与良好的光束质量,是半导体激光器领域的持续研究热点之一.本文开展了光
思想政治教育是人与人思想和心灵相互沟通、交流的双边活动。情感、意志、信念、兴趣等非理性因素在思想政治教育中具有重大作用,但面临着我国思想政治教育的唯理性、有效性
目的:制备甲苯咪唑-β-环糊精包合物,以提高甲苯咪唑的溶解度。方法:用正交设计方法优化出甲苯咪唑-β-环糊精包合物的最佳制备条件。结果:最佳包合条件:甲苯咪唑∶β-环糊精(重量
通过测定甲苯咪唑在不同浓度的倍他环糊精溶液中的溶解度,绘制溶解度曲线,得到的相溶解度图为Bs型,并由此求出包合物的表观稳定常数为39.58。
目的分析口腔科门诊医院感染的各种危险因素,加强医院感染的控制与预防。方法分析口腔科诊疗操作过程中存在的医院感染相关危险因素,提出有效预防与控制措施。结论规范口腔医
在野外调查四川省古蔺县近年来滑坡灾毁土地情况和特征的基础上,以蒿枝湾滑坡为例,分析蒿枝湾滑坡基本特征和灾毁土地现状,并从滑坡潜在稳定性、工程技术条件和社会经济效益
工程监理是工程项目建设中不可缺少的部分,监理提供的是一种专业化服务,由于现有监理体制的不完善,使得该领域存在着许多问题;本文列举了工程监理业存在的主要问题,分析和提
商誉是企业拥有的一项不可辨认的无形资产。在以知识经济为主的二十一世纪,商誉不仅成为无形资产的重要构成部分,而且占企业的总资产的比重越来越大.同时由于商誉的一些特殊的性