基于大数据的数据分析系统架构

来源 :中国新通信·理论版 | 被引量 : 0次 | 上传用户:tnzx911
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘 要:随着“互联网+”时代的发展,人们已经从各种信息数据的使用和接收方变为数据的发送方,基于大数据的应用日渐成熟,各种行业类型的数据时刻都在产生着,基于大数据的应用系统就是在如此庞大的数据量的基础上建立的应用系统,系统应当具备强大的数据处理和分析能力,才能够在海量的数据当中寻求出有价值的数据,为行业发展提供洞察力和优化行业流程,为决策层提供精准决策,从而使得用户能够掌握庞大的数据信息资产。基于大数据的应用技术核心优势就是对有价值的数据进行处理和分析,本课题研究介绍了基于大数据应用技术的数据分析系统架构的实现过程。
  关键词:大数据;数据分析;系统架构
  在信息时代的今天,各个行业领域都有大量的数据,善于分析利用这些数据,能够为行业带来巨大的发展空间,甚至能够引起行业的变革,因此基于大数据的应用的关键技术就是数据分析的系统的架构。
  基于大数据的应用的出现,给传统的数据分析系统架构带来了新的挑战,数据分析是隐藏在应用系统的背后,对于应用分析结果有举足轻重的作用,随着数据挖掘、探索等技术的发展,基于大数据的数据分析系统架构应该侧重解决传统数据分析的三个瓶颈问题:第一,分布式计算,分布式计算的设计思路是多个节点并行计算,强调的是数据本地化,数据尽可能少传输。第二,分布式存储,所谓分布式存储就是将一个大文件拆分为多个小文件分别存储到不同的主机,通过分片式管理技术对文件进行管理。第三,数据的检索和存储相结合,基于大数据的数据分析面临着海量的数据和多种数据类型,在不规范的数据中进行数据检索。
  一、基于大数据的应用系统架构
  在Hadoop体系的分布式应用中,基于大数据的数据分析应用架构已经和大数据信息架构互相结合,为各个行业领域在大数据的应用中带来了许多经济价值和数据信息资产,Hadoop体系采用云计算和分布式的应用技术,能够对大数据进行处理和分析,对未来大数据的信息中更大价值的数据源进行进一步的数据挖掘,会获得更大的数据潜在价值。
  (一)Hadoop对日志数据处理
  目前互联网站点的数量在呈指数级别增长,Web服务器会因为业务量的剧增而生成庞大的数据日志文件数据,其中包括了网址访问和业务数据流程处理的相关数据,这些日志文件数据会通过一系列的云计算算法处理后,上传到云端,通过分析处理这些数据能够反映给整个应用系统的实时运行状态,同时也可以反馈遇到的一系列系统异常问题。
  (二)Hadoop并行处理系统架构
  在Hadoop体系的分布式大数据应用中,数据采集模块会将采集到的各种类型的数据传送到Hadoop的并行处理系统架构中,然后信息数据被保存到HDFS中,传送的数据会被Hadoop体系中的MapReduce并行计算编程模型作为框架来进行系统化处理,MapReduce分布式的并行计算编程模型能够有效地解决数据分布范围大并且零散导致采集难的问题,这些信息数据会在分析前被分散到各个分节点,然后系统会利用就近原则读取相邻节点的数据,然后映射数据进行处理分析,经过处理分析后的数据会被再进行数据汇聚合并,所以基于Hadoop体系的大数据分析应用具备高速、可靠的特点,能够满足大数据的数据处理和分析的需求。
  二、基于大数据的数据分析系统架构
  (一)传统的大数据数据分析架构
  传统的大数据数据分析架构,传统的BI数据分析,由于数据量和系统性能不能满足大数据,所以基于此类的数据分析技术上是使用了大数据的数据分析组件替换传统的BI系统组件,保留了大数据的ETL操作,相对解决基于大数据的BI数据分析。整个架构相对简单易懂,缺点就是缺乏对实时数据分析的支持。
  (二)流式数据分析架构
  数据在应用过程中全部以流的形式进行分析处理,直接去掉了数据批处理,用数据通道替换了ETL操作,经过流式数据分析处理加工后的数据,以信息推送的方式推送给用户,相对于其他数据分析架构,流式架构由于取消ETL操作,所以数据的处理效率非常高,但是由于没有了数据批处理,没有很好的支撑数据统计和重播,不利于离线进行数据分析。
  (三)Lambda数据分析结构
  在大数据分析系统中Lambda架构是比较重要的一种数据分析架构方式,大多数的架构都是基于这种架构,Lambda架构的数据通道分为两个:实时数据流分析和离线数据分析,实时数据流的分析架构是流式架构,多数采用增量式计算,保障了数据处理分析的实时性,离线数据分析就以全量运算的数据批处理为主,保证了数据的一致性。在Lambda架构的最外层是一个实时和离线的数据分析合并层,这个合并层是Lambda架构的关键,既集合了实时数据分析和离线数据分析的优点,对于数据分析的应用比较广泛,适合于对实时数据分析和离线数据分析同时需求存在的场景。
  (四)Kappa数据分析架构
  Kappa数据分析架构是在Lambda架构的基础进行优化,在数据通道上把实时数据分析和流式数据分析进行了合并,以消息队列进行数据传输。在以Kappa架构的数据分析上来讲,还是以数据流的分析形式为主,不同的是数据存储是在数据湖层面上,当需要对离线数据分析或者执行重新的数据分析操作时候,只需要把数据从数据湖层以消息队列的方式将数据重播一次就行了。Kappa数据分析架构去除了Lambda架构当中的冗余部分,将数据分析重播作为创新的形式加入到架构当中,Kappa结构整体相当简洁,缺点就是虽然结构简洁,但是由于数据分析重播部分实现难度较高,所以总体架构难度比较大。
  (五)Unifield数据分析架构
  以上的几种数据分析架构都是以处理海量数据为主,Unifield数据分析架构是将数据处理分析与机器学习整合为一体,从架构的核心层面来看,Unifield数据分析架构还是基于Lambda架构,只是在数据流分析层加入了机器学习层,增加了数据模型训练,数据在加载后从数据通道到数据湖后,进行数据模型训练,然后提供给数据分析流层调用,同时数据分析流层会对数据进行持续的数据模型训练Unifield数据分析架构套数据分析与机器学习的架构,很好的解决了数据分析平台与人工智能领域相结合的问题,适合使用在基于大数据下的数据分析下的人工智能应用中,缺点就是由于整合了机器学习层,要求架构技术更高。
  三、结束语
  本课题分析了基于大数据的数据分析架构,并且提出了一些可行的数据分析架构方案,分别归纳出各种数据分析架构的性能、可靠性和优缺点,希望在未来的信息科技时代,我们能够善用大数据,为社会各行业提供更多的有价值数据分析,使得我国在大数据分析的技术方面迈向新的发展。
  参考文献:
  [1]陈琳,陈耀华.以信息化带动教育现代化路径探析[J].教育研究.2013(11).
  [2]王胜,聂立武,韩古月.智慧教育内涵与教学体系研究[J].辽宁高职学报.2015(11):21-23.
  [3]祝智庭,贺斌.智慧教育——教育信息化的新境界[J].电化教育研究.2012(12):5-7.
  [4]樊娜,黄雪琴.大数据时代下的个性化学习探讨[J].科技风,2015(7):23.
  [5]杨现民.信息时代智慧教育的内涵与特征[J].中国电化教育,2014(1):29-34.
  [6]陈律.大数据背景下学习分析技术对教学模式的变革[J].中国教育信息化,2015(24):15-17.
  作者簡介:
  李超宇(1982—),男,广西梧州人,高校讲师,网络工程师,工学硕士,主要从事云计算、大数据与计算机网络方面的研究。
  基金项目:
  2016年度广西壮族自治区中青年基础能力提升项目“基于大数据的教育技术信息平台的应用研究”(KY2016YB899)
其他文献
摘 要:随着社会经济在持续前进,现代化信息技术贯穿着人们的生活,在平日的生活当中都离不开互联网技术的支持,不管是与人进行交流,还是信息的获取,网络信息技术在很大程度上便捷了人们的生活。可是,因为有部分人使用网络实施违法犯罪的行为,所以,严重阻碍了网络的运行。在此基础上,本文的重点内容就是研究计算机网络信息安全以及防护的方法。  关键词:计算机;信息安全;防护措施  引言:  当下,现代化信息技术
期刊
摘 要:随着高速数字信号的快速发展,上电时序对多核处理器和高速接口集成电源的设计变得越来越重要。严格的上电时序保证设备不会损坏,并进入良好的工作状态。基于CPLD的多功率上电时序控制设计更加可靠、稳定和精确。  关键词:多电源;供电系统;上电时序;设计  引言  随着高速数字信号的快速发展,数字信号的处理方法越来越丰富。具有集成多核和高速接口的处理器为复杂嵌入式系统的设计提供了便利和灵活性。电源
期刊
摘 要:在当前我国电力行业的发展过程中,智能电网的发展逐渐受到了人们的关注。而智能电网和传统的电网相比较来说,前者能够通过对信息技术进行合理的应用提高电网运行的安全可靠性,有效地提高了我国电力行业的发展。本文就对当前智能电网在物联网中的实际应用进行分析。  关键词:智能电网;物联网技术;实际应用  一、简述物联网技术  随着当前我国科学技术和移动通信技术的不断发展和进步,物联网技术逐渐受到越来越
期刊
摘 要:备份飞行显示器是机上重要的组成部分之一,在飞行过程中作为备份系统提供姿态数据,能够精确指导飞行,提高飞机安全可靠的到达目的地。备份飞行显示器主要由信号处理板和图形处理板、导光板等组成,完成向航电系统输入命令并指导航电系统工作,同时通过ARINC429总线与外部设备进行通讯,解算、处理并最终在液晶显示屏上以数字和图表以及动态图形的方式实时显示飞行参数数据,备份飞行显示器能将飞行过程中某些故
期刊
摘 要:随着我国经济事业的不断发展,我国的电力事业也得到了进一步完善,目前不论什么企业的发展都离不开电力的运用。可想而知,电力不仅仅用于我们的生活上、学习上,企业上的用电规模也是很宏大,在我国电事业的发展越来越重要,但是安全也很重要,所以用电时一定要保证是安全用电,不可以在用电方面马虎大意。为了确保电力事业顺利的发展,一定要做好用电检查工作,这样才能更有效预防线路的损坏。下面文章讲诉的内容主要是:
期刊
摘 要:计算机信息技术不断发展,对我国当前社会做出巨大的贡献,能够促进我国经济的健康可持续发展,人们的生活水平直线上升,影响着人们的日常生活,人们生活中的电子科技越来越高端化,计算机在人们的生产和生活中的应用越来越广泛,因此,计算机信息管理系统安全问题成为人们当前关注的焦点,文章下述内容从计算机信息管理系统安全问题出发,找出存在的问题,并提出科学的解决措施,为我国计算机管理系统的安全运行打下坚实
期刊
摘 要:在当下,大型商场的地下车库都是非常大、地理位置结构复杂、车库内网络信号不好,停车难、找车难现象非常突出,如何解决对车库已停车辆进行定位,方便客户取车,这是一个急需解决的问题。如何利用现有资源,综合提升管理停车场,利用GPS定位技术、RFID技术,实现智慧停车场反向寻车,为车主提供寻车诱导,实现地下停车场智慧管理,缩短寻车时间,提高车库车位使用效率,更好地服务于人民群众的生活。  关键词:
期刊
摘 要:交通枢纽是高端移动用户聚集地,移动数据业务需求量很大,良好的网络及用户体验,促进数据业务使用,为运营商创造更大的价值,因此,做好交通枢纽无线网络覆盖,有利于抢占移动数据业务价值高地。本文以重庆市江北国际机场为例来探讨基于EPC的重大场景网络覆盖综合解决方案。  关键词:EPC;网络覆盖;江北国际机场  一、背景介绍  重庆市江北国际机场东航站区包括一座53万平方米的T3A航站楼和一条长3
期刊
摘 要:在当前经济和社会不断发展的趋势下,网络时代,信息安全要求对计算机的网络技术更加严格,为适应互联网的发展需要,其计算机信息安全技术也需要在全方面进行科学推动。而就在这推动过程中,仍然出现了大量的信息安全隐患,不少有关技术飞速发展的同时,并未注重其出现的系统漏洞和安全问题。因此,针对网络安全问题,我们必须严加防范,明确网络安全重要性,实施相关措施引用先进技术,以严格的意识,谨防信息安全问题。
期刊
摘 要:随着社会的发展,人们对计算机的依赖性也越来越高,计算机网络安全不仅直接关系到用户的个人隐私和财产安全,甚至影响着国家安全和民族发展。因此,加强计算机网络工程安全不仅对于我们个人非常重要,而且对于国家也具备重要意义。本文从计算机网络工程安全中常见的几种问题出发,深刻探讨分析了计算机网络工程安全的现状,并结合现行问题,提出可行性对策。  关键词:计算机;网络工程;安全问题  引言  互联网时
期刊