基于Hadoop平台的网站日志分析

来源 :信息系统工程 | 被引量 : 0次 | 上传用户:basilmhb
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网中每天产生大量的网络日志,通过对日志的分析挖掘,能够获取用户行为、偏好等信息。随着日志数据量的爆炸式增长,传统的单一节点分析方法已无法满足需求。随着大数据技术的不断成熟,通过Hadoop平台能够实现对大规模网站日志的分析。本文通过搭建4个节点的Hadoop平台,以Nginx用户访问日志为例,使用MapReduce计算模型对用户访问网站使用的浏览器类型进行了统计,并通过R语言进行分析结果的展示,为后续的网站决策及支持提供了参考依据。
其他文献
在当今社会,人类已然迈进了信息化的时代,同时伴随着计算机科学与技术的不断发展,以及互联网、云计算、大数据为显著特征的大环境下。迫使大批量的教育从业者的教学工作不得
一日,老爸路遇老友,他将老爸上下左右打量个遍,惊讶于老爸比同龄人至少年轻10岁,在临别时求老爸教以驻颜不老术,老爸想了想,送他四字:植树运动。多年来,老爸实践了一套“植树运动”的
摘 要 目的:通过对药物咨询的分析,提高药学服务质量。方法:将药物咨询的内容分类,再应用管理学上的帕累托图进行分析。结果:咨询者以护士和患者居多,所占比例分别为38.2%和36.3%;咨询药物以心脑血管和抗病原微生物药物、消化系统药物较多,所占比例分别为26.0%、17.1%、12.7%;咨询内容以前5项(药物用法用量、配伍联用、不良反应、名称价格、作用用途)为主要问题,药物求购等问题为次要事项。
据报道,布法罗大学的研究人员邀请30名20到40岁的志愿者参与实验。科学家们将志愿者分为三组。每日早餐为他们提供相同的饮食,但配备不同的饮料。为第一组志愿者提供的饮料为糖水,第二组为白开水,第三组则是鲜榨的橙汁。食用完毕后,科学家们将会在隔1小时,3小时和5小时之后对志愿者进行抽血化验。实验结果表明,飲用橙汁的一组志愿者血液中葡萄糖含量最少,且可提高免疫力的物质含量最多。因而,科学家们得出结论称,
近些年,随着计算机技术以及信息技术的进一步发展和完善,极大地推动通信网络的发展。但与此同时,在高速发展过程中,也暴露出来诸多问题,比如开放程度不够、信息传输速度较慢等,本文
摘 要 本文从《跨太平洋伙伴关系协议》(TPP)生物制品数据保护条款出发,在剖析条款要点与制度效应基础上,根据产业发展水平探究我国生物制品数据保护政策定位问题。研究发现,现阶段我国创新投入水平和居民支付能力与生物制品数据保护制度并不匹配,实施该制度的负效应将大正效应。建议我国在完善产业配套制度、促进产业转型升级的同时,审时度势,谨慎分析利弊,并设计相应谈判策略预案。  关键词 TPP 生物制品数据
老年人在健身过程中,身体各项机能都会发生很大变化,为自身的健康及安全着想,在健身时须进行自我监测。