大数据及在当代互联网应用中的研究

被引量 : 0次 | 上传用户:yanyansinx
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
据Gartner研究表明,每天我们要产生2.5QB的数据,而在目前全世界的所有的数据中,90%的数据是近2年内产生的[1]。这些数据来之与各个不同的地方,例如传感器收集到的天气的数据[2],在社交媒体网站上的帖子[3],数码相片和录像,购物产生的交易数据[4],甚至手机GPS的信号产生的地理数据[5]。那么这些数据就是所谓的大数据。随着全球的企业,政府组织开始认识到大数据的重要性,由机器传感器或者移动设备产生的数据以一个巨大的比例膨胀。有关机构预测在接下来的五年当中,这样的数据会增长超过650%,而这些数据大多都是机器和传感器产生的非结构化的数据。Gartner预测到了2015年,由于业务分析的需要,70%的投资会花在对企业IT信息架构的扩展和标准化,包括对服务器,存储架构,应用软件及服务的需求上面。如今大数据的影响力已经从企业,医疗扩散到了家庭宽带的设置和链接设备上。很快的成为了行业领先的分析数据的工具,比之前的工具更加便捷,而且节约成本。随着近几年来,互联网服务的飞速发展,国内的互联网三大巨头,百度,腾讯,阿里从好几年前就开始引入了大数据进行互联网业务决策。本文在这样的情况下,主要研究几方面的内容1.对大数据的现状和定义进行重新分析,深入了解何为大数据以及如今行业和市场对大数据的理解,再分析了大数据的多个研究方向,更好的了解大数据本身。2.对大数据普及的现状进行分析,阐述了如何对大数据的庞大数据集进行瘦身以及展望大数据市场未来发展的情况。3.从本人工作所涉及到的电子商务大数据预测的情况出发,对基于时间戳的网页点击数据进行预处理和分析,从而可以对业务进行更准确的预测。4.从目前流行的互联网在线社区获取数据,获取通过用户的属性,发现用户的典型行为模式,并且将用户分组,给互联网在线社区提供商进行决策依据。
其他文献
摆脱贫困、促进国民财富增长是经济发展的主题,这并不容易,贫困与饥荒时常相伴,森提出了“权利方法”研究饥荒,几乎否定了EAD对饥荒的解释,权利方法强调了市场、社会公正在解
纵观韩国古典小说 ,其主题主要是“劝善惩恶” ,其情节模式多是“苦尽甘来”。如此主题和情节模式都有着其政治、社会原因 ,同时也有深刻的美学原因。
唐代仕女画中的女性形象鲜明独特,本文在考察唐代仕女画中女性形象特征的基础上,探讨了唐代宫廷女性独特的审美观及其形成与当时社会生活的内在联系。
营养素是诱导及维持正常肠道黏膜免疫的重要因素。许多营养素,包括谷氨酰胺及其它氨基酸、部分脂肪酸、微量营养素等均可以影响黏膜免疫功能。均衡的营养有助于维持人体正常
【目的】探讨发育性语言障碍儿童除语言外其他能力的发育特征,为临床综合防治提供依据。【方法】采用Gesell智力发育诊断检查量表,对60名发育性语言障碍儿进行发育评估,并以6
【目的】通过对我国关于儿童语言发育研究的文献进行计量分析,梳理该领域的研究历史和现状,为深入开展儿童语言发育研究提供参考。【方法】以文献计量学的基本定律作为数据分
高新技术产业作为我国国民经济的支柱产业,不仅对我国绿色GDP的增长贡献较大,其还通过扩散、渗透等方式推动我国产业结构的优化升级,因此其对我国经济的发展影响重大。但高新
众所周知,美国电视剧是世界电视剧市场中的翘楚,其电视剧产业具有极高的商业性,获得了全世界公认的巨大成功,而其背后的原因也成为众多学者探究的课题。本文希望在广泛借鉴中
目的对经过甲醛检测的家庭进行室内甲醛污染与人体健康关系的调查,探索两者之间的内在联系。方法对2005-2017年进行甲醛检测的1 821户家庭进行健康问卷调查、分析。结果室内
目的 探讨多功能可透视医用平车在股骨干骨折患者护理中的应用效果。方法 选取医院2015年4月至2018年2月收治的84例股骨干骨折患者,采用随机分组的方式分为两组,每组42例。对