基于hadoop的web管理系统

被引量 : 10次 | 上传用户:kekedala
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
从20世纪40年代第一台计算机出现发展到现在,计算机的硬件、软件系统都取得了突飞猛进的进步。用于存储数据的计算机硬盘从1956年的5M到现在的动辙上TB的容量已极其平常。硬件的巨大发展,在很大程序上推动了整个行业乃至影响到其它相关行业的发展。因此处于大数据时代的各行业的大小企业怎么应对TB、PB级别的商业数据处理呢?答案是建立企业级的大数据处理平台。然而大数据处理对于普通程序员而言都不是一件简单的事情,因此,搭建一个面向企业普通管理者和数据分析人员的数据管理系统,是本文主要研究的内容。Hadoop从2005年发展至今,已吸引了许多关注大数据人士的眼球。作为开源的大数据处理平台技术的hadoop,是受美国谷歌公司发表的关于分布式处理技术文章的启发而诞生的。它功能强大,专为大数据处理挖掘而设计,具有良好的稳定性和可扩展性。更为吸引人的是,hadoop对机器硬件配置要求不高,一台普通配置的PC主机便能顺利流畅地运行hadoop平台。因此hadoop成为实现此web管理系统的不二选择。Hadoop的主要关键技术是hdfs文件系统、map/reduce编程模型。前者主要负责存储超大数据文件,是map/reduce程序运行的数据来源;而后者则是大数据处理分析的数学模型,通过编程实现map和reduce两个函数,在hadoop集群上遍历hdfs文件块,运行map/reduce任务而得到用户想要获取的数据信息。然而让一个普通的用户去完成相应的程序编写未免不太现实。为了让一般用户使用hadoop平台,封装map/reduce编程实现代码,因此本文使用了基于hadoop的数据仓库:hive这一工具。利用Hive的类SQL的HQL语句查询功能,用户可以进行对大数据集的简单逻辑查询。Hadoop集群主要运行在linux系统上,linux对于一般用户而言还是比较难亲近。为此本文开发了一个基于web的管理系统,用户只需要打开浏览器,输入管理系统网址,便能通过网页查看存储于hadoop集群上的hdfs文件块,也能通过指定查询参数、过滤条件而对hdfs文件系统上的数据进行分析处理,因此web服务器主机与hadoop主机的通信也是本文详细讨论的关键技术。由以上可知,要搭建一个基于hadoop的web管理系统,本文主要研究的两个方面是hadoop平台与web管理网站开发。Hadoop平台主要负责大数据文件的存储、大数据查询操作,而web管理网站提供用户操作查看的界面。用户通过web界面输入信息,web服务器主机取得用户的输入,通过socket的Tcp协议,向hadoop主机发送用户想要查看的数据参数,hadoop主机上运行的客户端程序通过tcp接收到查询请求后,按照通信协议解析查询指令,生成正确的HQL语句,hive执行HQL语句之后得到的查询结果通过socket被传送回web服务器主机,最后通过浏览器web网页显示出来呈现在用户的面前。以上就是本文主要研究的系统通信过程。
其他文献
随着近年来滑雪运动在中国悄然兴起,很多地区快速完成了滑雪场地的建设,国内滑雪人数呈跳跃式增长,冰雪旅游发展呈现出令人振奋的势头。天然的滑雪场已不能满足国内特别是南方地
当下,文化已成为衡量国家或地区发展的重要指标,成为国与国之间新的竞争领域,十七届六中全会正是在此背景下提出了建设社会主义文化强国这一重大发展战略。文化硬实力不仅是
1985年瑞典皇家学院将诺贝尔文学奖颁发给了克洛德·西蒙。得奖时,西蒙已孜孜不倦地在文学道路上探索了四十多年,本文所要研究的《农事诗》(1981)是其耗时最久的一部作品,以
随着互联网的极速发展,互联网产生的信息数据成爆炸式增长。互联网已经从信息匮乏迅速转入信息过于庞大而难以甄选有效信息的时代。文本信息作为传递信息的一种载体,依然是人
软件定义网络(Software Defined Networking, SDN)通过软件的形式重构了现有网络,其集中控制、控制与数据分离以及可编程开放等特性对未来网络技术的发展产生深远影响。从安
随着互联网的迅速发展,特别是近年来,突飞猛进的移动互联网和电子商务的发展,网络已经进入了互联网+时代。“互联网+”时代具有如下特点:大规模数据集,多终端等。企业建立一套IT系
传统园艺栽培与管理中存在着大量需要依靠人的视觉进行辨识和计量的繁重劳动。应用先进的机器视觉技术可以使得这些工作实现自动化与智能化,从而显著降低劳动强度,提高工作效
快速伸缩复合训练(Plyometrics)是一种有效发展速度的一种方法,它将速度和力量巧妙的融合在一起。快速伸缩复合训练(Plyometrics),是通过离心-向心收缩,在尽可能短的时间内使肌肉达
大数据时代的来临给各个行业带来了翻天覆地的变化,人们已经逐渐意识到数据的重要性。大数据的巨大作用已经渗透到各行各业中去,成为了继云计算、物联网之后IT行业又一大颠覆
火炮膛内动态压力是火炮在研发、设计和验收时测试的重要参数之一。各个国家都在积极研究膛压测试的方法,但是就目前来说,大多数测试方法仅能测得膛内某一点的压力。这对于研究