日志采集与分析在Web网站中的设计与实现

被引量 : 0次 | 上传用户:zjl658788
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着大数据的流行,越来越多的企业对大数据变得重视起来,都希望能够通过大数据来分析用户的行为,为企业的决策提供进一步的指导。在这样的前提下,Web站点采集用户数据并加以分析变得越来越流行,并且切实地帮助了企业了解用户行为,进一步改善产品质量。本文主要研究Web网站的日志收集和分析,利用相关的JavaScript API对网页上用户的行为进行日志采集,然后对数据进行加工处理,最后利用分析的结果给企业提供决策支持。本文叙述了日志采集和分析的整个流程的关键技术、分析了系统的需求、设计了系统的整体架构。本文叙述了①日志采集系统的设计目标,然后围绕设计目标对API进行设计,②考虑到日志内容有可能比较大、网页会在手机等设备上面运行、网页不频繁刷新等特点,出于节省流量以及提高性能的目的,本文使用隐藏iframe来提交日志,而非利用隐藏的gif的URL刷新来提交日志,③日志发送到日志服务器后,考虑到大规模日志的情况,我们将会使用多台日志服务器并使用负载均衡,日志服务器把日志写到微软Azure存储系统,文件路径由机器名和日志时间构成,每5分钟生成一个新文件,④由后端分布式处理系统把文本日志转化成结构化日志,再用定期运行的脚本读取和处理结构化日志,生成一些常规性报表(比如每天用户数、会话数、新用户趋势等),利用SQL SERVER的Reporting Service进行报表展现,⑤把数据进行聚合再推送到数据库,利用数据库挖掘工具进行数据挖掘。在数据处理方面,考虑到数据量会很大,我们使用分布式处理系统COSMOS对数据进行处理,在大数据情况下得到了良好的性能。最后系统开发完成后通过了系统测试,并且在应用到实际生活中后系统的运行状态良好,利用日志分析的结果帮企业提供了有用的决策,证明该系统是可行并且有效的。相比于其他的系统,本文的研究内容主要有以下特点:1.企业能够得到完整的原始日志,并且基于原始日志生成多种自定义报表或者数据挖掘。2.本系统在浏览器客户端使用隐藏iframe技术,优点是一次能提交更大的数据,不用频繁提交数据,对于使用ajax来交互的站点,本系统采集数据更加节省流量。
其他文献
阅读教学在小学英语教学中占有十分重要的地位。本文研究分析了小学英语阅读的教学现状及其重要性,并对如何提高小学英语阅读教学进行了探讨。
针对传统的雨水汇水面积划分方法对地形考虑粗略、自动化程度低和人为因素影响大的特点,以城市路网和雨水管线共同组成的排水路线为研究对象,结合数字高程模型(DEM)数据,通过
企业重视对石油化工废水的回收和处理,阐述了石油化工企业废水的产生和特点,对石油化工废水处理技术的新进展做了简单介绍,并对石化废水处理的前景进行了展望。
<正>缓闭蝶式止回阀是一种新型的水力控制阀,兼有止回阀、水锤吸纳器的功能,起到"一阀"代"两阀"的作用,是一种能按照预先调定好的特性,分三阶段关闭(先快关一定角度、再慢关
以青岛市蓝色硅谷某超深全地下污水泵站为例,介绍了超深地下结构池壁的计算方法,通过适当简化并采用有限元软件Midas对该地下结构进行整体建模分析,得出地下结构的受力分布规
文从语境的角度出发对“哑巴英语”这种现象进行了探讨,认为英语学习过程中语境信息的缺失和学生英语自我形象受损是“哑巴英语”产生的主要原因,并据此提出了相应的教学对策
随着互联网金融时代和移动互联网时代的到来,金融的发展进入一个新的层次,更加凸显社交的意义,本文旨在通过对互联网金融发展现状的分析,结合社交的理论,旨在解决新时代下行
本研究首先通过实地测量、资料调研了解了大型飞机驾驶舱的空间尺寸及功能布局,对国际上及中国商用飞机驾驶舱造型设计的历史及现状进行了分析。接下来搜集了世界主要飞机制
介绍了一种改良型A2/O工艺在云南省某小型污水厂的设计及其运行情况。该厂近期工程规模为1.0×104m3/d,原水全部为生活污水,采用两点回泥、增设预缺氧池的改良A2/O工艺,出水
"战争政治"即是对战争作政治化理解,强调战争背后的政治因素,以及战争给政治的其他层面带来的影响。抗战戏剧是20世纪中国一个独特的文化现象,寓含着丰富复杂的战争政治因素,