基于云计算环境的大数据分析应用系统文献调研

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:wangzhaohai
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在第二十一世纪,许多IT公司和组织决定采用的云计算与大数据技术。大数据已经成为IT领域一个非常重要的创新和成长点,例如云计算,物联网和数据分析的广泛应用。大数据分析(Big data analytics,简称BDA)可以帮助有关部门更好地理解信息中包含的数据,也有助于识别数据,最重要的是要发现数据中存在的价值。  对于企业市场,有大量的例子证明了大数据分析的价值,如脸谱站,亚马逊河和谷歌等公司已经开始将大数据作为它们主要营销计划的一部分,以便更好地为客户服务。在分析数据时,BDA通常使用专门用于预测分析、应用数据挖掘、文本挖掘、预测和数据优化的软件工具,这就都需要云计算的技术支持。  在过去的二十年中,云计算是一种高效的面向服务的计算平台。云计算和大数据之间的关系是云计算为大数据项目提供存储项目和计算平台。  系统化文献调研(Systematic literature review,简称SLR)于2004年开始得到了软件工程研究人员的广泛关注。很多研究者报道了他们在软件工程中不同的研究领域应用系统化文献调研进行经验软件研究。软件工程从业者为了获得深入的了解,将系统性评价作为软件工程的一种新的研究方法。他们认为系统化文献调研是一种使用基于证据的知识体系的系统化文献综述方法。系统化文献调研作为一种系统化综述,被认为是基于证据的软件工程研究领域的一种关键研究方法学。  系统化文献调研在得到广泛的关注之后,软件工程的研究者们在许许多多不同的研究当中使用了系统化文献调研,例如敏捷软件开发、回归测试、流程建模、可变性管理、成本估算等。研究者们也在发表的论文中总结归纳出了系统化文献调研的最佳实践方法以及他们使用系统化文献调研的经验。此外,系统化文献调研的技术策略评估以及质量报告也在研究中被提出。随着软件工程研究者们对系统化文献调研的兴趣的不断提高,系统化文献调研就必须提供适当的方法论指导其设计、执行和报告高质量的系统评价。  本研究的目的是系统地研究现有的大数据以及云计算技术,总结了该技术的研究动向,主要介绍了大数据与云技术的相关技术和相关软件以及研究方法。为了进行调查和分析结果,本研究采用基于证据的软件工程范式的系统的审查方法。  本论文提出了一个云技术与大数据分析的系统化文献调研(SLR)的研究文章。基于预定义的搜索策略,对717个文章进行了评估和鉴定,其中包括57个重要相关文献,选定的57篇文章发表在2010和2016年之间。  论文定义了一个审查过程,通过制定审查协议,并提交审查的结果。本研究首先提出一个研究问题并通过对57篇文章的回顾和分析,试图回答这些问题,5W+1H分析法(what-什么事情,where-什么地点,when-什么时候,who-责任人,why-原因,how-如何)。研究结果将提供给研究人员,软件项目者和软件工程师关于现有的大数据分析云计算的现有方法的更多信息。我们正专注于如何将大数据和云计算纳入一个发展框架。此外,本文给出了关于云计算的大数据分析总结列表。  本文发现,将大数据部署在云平台上面临一些有待解决的问题和挑战,例如数据安全和隐私保护等问题。虽然有一些研究者提出了部分应对方法,但本系统化文献调研发现这方面研究仍处于早期阶段,因此仍需要进一步进行深入研究。  本文还给出了一系列的关于大数据和商务智能的论文清单,总结并给出了表格。
其他文献
随着企业的信息化建设不断发展,企业建立了大量的IT系统,这些IT系统在运营过程中每天产生大量的事件信息,企业需要通过这些事件信息来判断IT系统的运营情况。然而,由于事件信
复杂网络作为一种描述和分析现实复杂系统的重要工具而广受关注,学者们已经对网络的物理意义和数学特性等方面进行了深入地研究。复杂系统是随着时间不断变化的,将不同时刻的系
随着计算机的普及,网络进入了高速发展的阶段,逐步成为了人们生活中的一部分。人们获取信息的方式也逐渐从广播、电视、报纸转移到了网络。通过网络社区,民众可以表达情绪、态度
图像分割就是把图像分成各具特性的区域并提取出感兴趣目标的技术和过程。它是图像处理到图像分析的关键步骤,也是一经典难题。本文对模糊聚类理论、标准FCM算法和基于FCM算
面向服务的体系结构(SOA)因具有开放化、智能化和个性化特点,满足了日益增长的网络需求。如何从众多Web服务中获得最符合用户请求的服务,成为了诸多研究者的关注热点。随着语
产品评论挖掘就是抽取网络评论中的用户评价信息,从而为消费者开展理性消费以及企业改进产品、提高竞争力提供必要的参考信息。特征词与观点词挖掘是产品评论挖掘领域非常重要
显微镜细胞图像自动分类识别是生物医学的热点研究内容之一。镜检体液中有形成分检测是医学临床检验的重点,因此,镜检体液细胞图像自动识别与分析的实现不仅可以提高医学检测的
随着信息科学技术的高速发展,伴随而来的是多样的媒体数据飞速增长,这得益于数字设备的普及和存储技术的发展。面对大量无标签数据的产生,如文本、音频、图像及视频等,如何管
汉语拼音教学是小学语文教学和对外汉语教学的基础,能工整、规范地书写汉语拼音是教学的基本要求。目前有关汉语拼音教学的方法及相关教具存在的共同问题是忽视汉语拼音的自由
基于Web服务的应用现在越来越多,而安全性是Web服务的一个重要组成部分。近年来一些国际组织发布了一系列安全相关的标准和建议,但是当前的安全服务仍存在很多的缺陷,无论是在安