大数据处理技术与系统研究

来源 :科技信息·下旬刊 | 被引量 : 0次 | 上传用户:simon_01
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘要:由于在大数据处理中应用了多种技术手段,大数据处理具有极强的综合性。因为大数据在应用过程中产生的大多数问题都与电脑行业存在非常密切的联系,所以大数据具备了极强的应用需求驱动性,需要与电脑领域进行有效的融合,从而更好实现大数据的社会价值与商业价值。当前必须提升对大数据的认知,并加强对该领域的研究。
  关键词:融合思想;云计算;大数据处理
  1基于融合思想的大数据整合方案
  在云计算环境下,人机交互技术、数据处理技术、采集处理技术等技术始终处于一种深度融合的状态。融合思想的出发点就是将云环境下的处于分散状态的采集资源以协同的方式组织起来,然后进行融合,充分发挥各种分散状态下资源的比较优势。作为一种有机整合各种比较优势的思想,融合式的整合方案具有广阔的应用前景。在云计算环境之下,大数据处理的研究主要着眼于大数据处理系统的建设、分散式数据的协同方式以及附属关键技术等。从宏观而言,可以简单地把上述着眼点划分为混合处理以及混合管理2个方面:混合管理的研究点主要基于各种有线无线的处理机制、数据共享机制、处理资源共享机制、分散数据管理机制、处理同步机制等,而混合处理主要着眼于系统运行模型及相关的支持技术上。
  融合思想是解决当前云计算相关问题的一种前沿性思想,在大数据处理模型上,主要研究的是大数据组成因子的协作、共同完成大数据处理的模式,涉及到成员间如何开展工作,协作时如何进行交互、操作协调、协作推进和结束协作等,主要包含会话模型、会议模型、过程模型、活动模型和层次模型。会话模型是各因子间沟通和动作协调的基础,通过特定的言语行为(如请求、许诺等)的執行来完成。会议模型是群体进行协同工作的另一种基本形式,参与者通过共享的信息空间彼此沟通,共同完成任务。过程模型将复杂的任务分成一个个小的操作步骤,活动模型对过程模型进一步扩充,将任务分成目标明确的子任务,定义子任务之间的关系,并通过任务的协同处理来完成任务。
  2大数据处理的应用分析
  在云环境中,由于大数据在云环境下的组成因子间的架构、大小等可能存在着巨大的差异。抽象后的处理架构包含的基本组成因子有:处理成员的权限、公用处理资源、处理事件和处理活动。处理成员的权限描述了某一处理数据流在系统内部的操作和处理权限,根据处理需要对数据流进行合流的划片和分级来赋予相应的权限;公用处理资源描述了云环境下的各子云所共用的处理信道、信令以及指挥处理机制;处理活动描述了处理过程中的发送、处理、接收过程中的全部动态行为的总体性特征;处理事件描述了处理活动中的处理进度、指标的集合,用于协调各因子间的行为。目前,大数据处理主要着眼于应用系统的建设,主要的解决思路围绕着以下的3点展开:
  (1)融合式架构实际上是一种客户/服务器架构、服务器集中负责整个应用系统的管理、控制和调度,以及所有与具体应用相关的程序逻辑、数据等,客户端指用户交互的输入输出。当用户要执行相关任务时,需要通过客户端向服务器发出请求,由服务器完成相对应的任务。融合式的协同应用架构实现简单、容易维护,但协同应用对服务器有较强的依赖,很容易成为整个系统的瓶颈。
  (2)分散式架构中,协同控制的节点均处于同等地位,与系统相关的控制和管理模块分散在客户端。客户端较好地实现了系统的自治,其鲁棒性、灵活性、开放性和通用性都比较好,但数据的分布存储和各自操作,使得全局的一致性较难维护,节点间的实时性同步以及用户的动态注册也较难实现。
  (3)混合式结构结合了前两种结构的优点,由服务器实现数据信息的一致性维护、用户管理和信息的转发与分发等功能,由客户端实现与用户的交互。这种结构充分利用了客户端的资源,极大地减轻了服务器的工作压力,减轻了服务器的“瓶颈”效应,既能使系统具有较好的灵活性、鲁棒性和较短的响应时间,又保证了系统信息的一致性。
  3大规模 RDF 语义数据存储管理技术与系统
  3.1 RDF 数据索引机制与索引数据存放策略
  3.1.1 查询空间
  通常情况下,RDF 三元组数据库在记录数据的过程中,往往会采取索引技术,从而进一步提升查询时三元组配对成功的概率。当前RDF 三元组数据库设计的索引方案,全部都是以标准数据库为基础进行相关的设计,因而要重点分析 RDF数据之间的相关性、结构方面的特性。将运用最频繁的三元组查询模式做为基础,构建出更为高效的索引机制,进一步提升查询速度,从而保证大部分SPARQL 查询的响应性能达到最佳效果。
  3.1.2 索引策略
  字符串是RDF三元组主谓宾成分的主要表现形式,通常情况下,字符串会相对较长。为了使实际RDF数据的存储空间得到进一步压缩,Rainbow系统中RDF三元组中的主谓宾成分的索引数据需要以哈希表方式为基础,进行相关的维护管理工作,这点与部分RDF三元组数据库基本一致。在经过编码压缩之后,RDF三元组的存储空间与原来相比显著缩减,而且还能节约内存和磁盘的储存空间,避免了中间结果存储所增加的数据存储量。此外,在查询的过程中,中间结果仍然依赖于采集进行传输,因而中间结果集的大大缩减,能够有效减少采集所需要传输量,而且查询的整体性能将会得到提升。
  3.2 分布式层次化索引数据存储管理方法
  因为Hadoop大数据处理技术生态系统的应用越来越普遍,并且也成为大数据存储管理的工业化指标,所以在实际的应用中,大多数分布式RDF三元数据库都将HBase这一系统作为底层大规模RDF数据的存储平台,这也是HBase系统可拓展性和容错性的重要表现。以分布式层次化为基础的索引存储管理机制,能够更好完成RDF数据的查询、存储等。
  结语:
  在宽带互联网接入技术及智能终端高速普及的今天,采集数据容量以及处理数据量/数据强度的增加速度大大快于任何一个时期;大数据时代已经悄然来临。大数据时代是伴随着云技术的发展而来的,如何在云环境下进行安全、有效、准确的大数据处理,成为人们研究的一个热点领域。
  参考文献:
  [1]李程.基于大数据处理技术的防范信息诈骗系统探讨[J].广东通信技术,2017,37(10):44-48.
  [2]许杰,冷冰,李明桂,丁文超.大数据处理技术在安全审计系统中的应用[J].通信技术,2016,49(03):346-351.
  [3]任梁.试论云计算技术下的大数据处理系统[J].电子技术与软件工程,2014(16):27.
  [4]王书海,张婧.基于SQL Server应用系统的大数据量实时处理技术[J].实验室研究与探索,2008(03):16-18+85.
其他文献
摘要:生物强化技术是在传统生物技术中引申出的一种新型的科学技术。本文将针对生物强化技术在水污染治理中应用的作用进行详细的分析,其目的便是研究出生物强化技术在水污染治理中应用参数,以便于保障生物技术的高效运用。  关键词:生物强化技术;水污染治理;运用  自从改革开放以来,我国经济水平不断的提升,水资源安全、环境问题也成为我国社会的重要问题。生物强化技术有着强大降解功能和杀菌功能,可以祛除有毒有害物
期刊
摘要:目前在社会发展的过程中其生产、生活等都离不开水资源的应用,而这也可能导致一些污水未经处理就进行排放,此种问题将会为水资源环境带来严重的负面影响,其中地下水属于主要受到污染的部分之一。针对此种情况则需要采取适当的监测技术来对地下水环境进行监控,以此来获取精准的地下水环境数据,从而为地下水环境的保护工作提供科学的数据支持。  关键词:地下水环境;监测技术;方法建议  水资源污染是我国发展过程中主
期刊
摘要:节能型风景园林施工技术的有效贯彻,一方面能够凭借生态园林体系的植被功能协调地区生态环境,有效提升居民的生活质量;另一方面根据先进的施工技术及理念,更可以为后续工程节能减排提供可持续拓展渠道,由此增强施工技术人员的操作水准,更能够为生态城市的构建提供质量保障。本文基于节能型风景园林施工的创建展开分析,在明确节能型技术特点及应用策略同时,期望能够为后续生态园林的可持续构建提供良好参照。  关键词
期刊
摘要:甘孜州由于其特殊的地理环境,水利资源较为丰富,在整个四川省内也占据着十分重要的地位。甘孜州水电开发可改善全州内的能源结构,推动甘孜州矿业的发展,加大甘孜州民生改善力度。本文首先从甘孜州水电开发遗留问题入手,接着阐述了甘孜州水电开发对生态环境的影响,最后总结了甘孜州水电开发对生态环境解决对策,旨在为推动甘孜州经济的发展提供参考性意见。  关键词:甘孜州;水电开发;生态环境;影响;解决对策  甘
期刊
摘要:在进行铜铁矿井下采掘工程施工的时候,必须要采用帷幕注浆堵水工艺来进行施工,这样在进行同铁矿采掘的时候,出现大面积地表塌陷现象的概率就会得到降低,在进行采掘之前必须要做好充分的生态安全预警工作,这样才能避免在进行裁决工程施工的过程中出现局部塌陷的现象。本文就铁矿井下采掘工作的环境影响及生态保护进行研究,希望能够在一定程度上降低铜铁矿井下采掘工作对学员地质环境造成的影响。  关键词:井下采掘工程
期刊
摘要:从社会发展角度来说,森林资源是一种不可替代的基础资源,与国家经济发展之间有着不可分割的密切联系,这也是国家针对森林资源开展全面控制工作的主要原因。森林资源的利用以及管理工作都是由政府负责,同时政府也要接受来自于社会各界的监督。为促使森林资源培育工作实现科学化以及合理化的目标,我们需要针对森林资源管理工作体系进行不断的建立与完善。我们可在客观分析森林资源培育以及管护工作的基础上,针对其中存在的
期刊
摘要:借本岗工作之便,对辖区内松茸主产区的现状数据进行统计、调查和总结,提高了本单位松茸经营管理工作力度。  关键词:松茸;现状;调查  松茸作为一种人工不可替代的纯天然珍稀名贵菌类,是林区不可多得的山中极品美食,其保健、抗癌作用非常之大,由于年产量产出少,所以经济价值非常之高,目前国际市场需求看涨。向岭经营所作为松茸主产区之一,为切实保护、利用和管理好现有松茸資源,促进松茸产业的可持续开发及良性
期刊
摘要:本文主要结合我国电子信息产业节能减排的发展现况,与国际上发达国家之间存在的差距;详细分析了目前我国在电子信息产业节能减排方面存在的主要问题,同时对存在的问题进行认真分析后,提出促进节能减排的几种措施。  关键词:电子信息;节能减排;发展  节约能源、提高资源综合利用率是我国的一项重要战略方针。由于中国地区经济发展不均衡,各省域节能减排绩效工作存在较大差异,实现各省能源、环境和经济的全面协调发
期刊
摘要:固定资产管理水平能反映出医院的整体管理水平,医院固定资产的数量和医院规模大小、医疗器械的数量有着直接关系,因而需要加强医院固定资产管理,进而提高资产的使用效益和醫院的综合实力。文章梳理和分析了当前医院固定资产管理现状,并针对问题提出相关策略,以期加强管理,并有效提高资产使用效益。  关键词:医院固定资产;管理;使用效益  我国医疗体制的不断深化改革,对医院的建设和管理工作发挥了重大作用。国家
期刊
摘要:出租车计价器的使用,使得出租车价格变得透明,在一定程度上维护了司机和乘客双方的利益。但是计价器在使用过程中,由于自身故障或人为改装等因素的影响,常常会出现计量不准确的问题,引发了乘客与司机的纠纷。计量检验检测中心需要结合出租车行业的发展需要,不断对现行的计价器检定方法进行优化,确保出租车计价更加合理,营造和谐的驾乘环境。  关键词:出租车计价器;存在问题;二次鉴定;计量方法  引言:  为了
期刊