论文部分内容阅读
在第二十一世纪,许多IT公司和组织决定采用的云计算与大数据技术。大数据已经成为IT领域一个非常重要的创新和成长点,例如云计算,物联网和数据分析的广泛应用。大数据分析(Big data analytics,简称BDA)可以帮助有关部门更好地理解信息中包含的数据,也有助于识别数据,最重要的是要发现数据中存在的价值。 对于企业市场,有大量的例子证明了大数据分析的价值,如脸谱站,亚马逊河和谷歌等公司已经开始将大数据作为它们主要营销计划的一部分,以便更好地为客户服务。在分析数据时,BDA通常使用专门用于预测分析、应用数据挖掘、文本挖掘、预测和数据优化的软件工具,这就都需要云计算的技术支持。 在过去的二十年中,云计算是一种高效的面向服务的计算平台。云计算和大数据之间的关系是云计算为大数据项目提供存储项目和计算平台。 系统化文献调研(Systematic literature review,简称SLR)于2004年开始得到了软件工程研究人员的广泛关注。很多研究者报道了他们在软件工程中不同的研究领域应用系统化文献调研进行经验软件研究。软件工程从业者为了获得深入的了解,将系统性评价作为软件工程的一种新的研究方法。他们认为系统化文献调研是一种使用基于证据的知识体系的系统化文献综述方法。系统化文献调研作为一种系统化综述,被认为是基于证据的软件工程研究领域的一种关键研究方法学。 系统化文献调研在得到广泛的关注之后,软件工程的研究者们在许许多多不同的研究当中使用了系统化文献调研,例如敏捷软件开发、回归测试、流程建模、可变性管理、成本估算等。研究者们也在发表的论文中总结归纳出了系统化文献调研的最佳实践方法以及他们使用系统化文献调研的经验。此外,系统化文献调研的技术策略评估以及质量报告也在研究中被提出。随着软件工程研究者们对系统化文献调研的兴趣的不断提高,系统化文献调研就必须提供适当的方法论指导其设计、执行和报告高质量的系统评价。 本研究的目的是系统地研究现有的大数据以及云计算技术,总结了该技术的研究动向,主要介绍了大数据与云技术的相关技术和相关软件以及研究方法。为了进行调查和分析结果,本研究采用基于证据的软件工程范式的系统的审查方法。 本论文提出了一个云技术与大数据分析的系统化文献调研(SLR)的研究文章。基于预定义的搜索策略,对717个文章进行了评估和鉴定,其中包括57个重要相关文献,选定的57篇文章发表在2010和2016年之间。 论文定义了一个审查过程,通过制定审查协议,并提交审查的结果。本研究首先提出一个研究问题并通过对57篇文章的回顾和分析,试图回答这些问题,5W+1H分析法(what-什么事情,where-什么地点,when-什么时候,who-责任人,why-原因,how-如何)。研究结果将提供给研究人员,软件项目者和软件工程师关于现有的大数据分析云计算的现有方法的更多信息。我们正专注于如何将大数据和云计算纳入一个发展框架。此外,本文给出了关于云计算的大数据分析总结列表。 本文发现,将大数据部署在云平台上面临一些有待解决的问题和挑战,例如数据安全和隐私保护等问题。虽然有一些研究者提出了部分应对方法,但本系统化文献调研发现这方面研究仍处于早期阶段,因此仍需要进一步进行深入研究。 本文还给出了一系列的关于大数据和商务智能的论文清单,总结并给出了表格。