Web站点安全日志分析系统的分析与设计

来源 :北京邮电大学 | 被引量 : 8次 | 上传用户:game780
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网快速的发展,使得国内网站快速成长,诞生了大批大型的网站,如新浪,搜狐,网易等。这些网站中,中小型的WEB站点更是不计其数。在这些网站的建构过程中,网站设计者一般只关注对外部的用户访问速度,对于用户体验,则关注较少。为了改善用户体验,网站的相关技术人员需要在维护大量的线上服务器的同时,对站点是否能被用户正常访问实施监控。通过这种监控,了解服务器运行的状况,网站维护人员通过对日志的分析,明确网站运行的问题所在,同时将此问题及时解决,使客户端的网站访问恢复正常。本论文针对WEB站点的日志挖掘来判断用户恶意的攻击及搜索引擎抓取过于频繁等问题,以WEB站点产生的日志为主要研究对象,对日志进行了挖掘过滤分析,在对HTTP协议相关内容了解后,对日志分析结果作了分析研究。并设计日志分析系统的解决方案。包括核心分析系统,结果展示系统,服务器信息维护系统。该系统能及时查询到上一时间段分析日志的服务器所收到的请求类型、状态、状态数量及请求数等,通过上一时间段服务器运行数据,来判断程序逻辑严密性,用户体验好坏,是否有用户恶意请求,搜索引擎抓取是否过于频繁等问题。论文主要工作包括以下几点。(1)挖掘Web用户访问日志,并做分析统计,将分析结果保存于数据库。因为对于访问量大的站点来说,每个小时的日志文件会比较大,如果需要寻找问题,直接打开日志文件是比较耗费内存和相关资源的。因此将日志过滤并统计出结果是维护人员快速的找到问题所在。对大流量站点来说,该系统的重要性和应用性体现在,能及早找到问题,将损失降到最低。(2)设计出查询高效、结构优化的分析结果数据库系统,使得统计数据得以有效管理和快速查询的实现,从而使问题得以快速解决,这对于维护者解决问题很关键。在数据库设计上会考虑服务器端常会出现的问题。Web服务器返回状态码为500和503的情况是客户端经常遇到的,time-taken即所花时间也是一个重要的参数。所用时间表示服务器端响应花费的时间,它是服务器端程序效率的一个重要标志。花费时间越长,服务器端效率越低。在客户端用户感觉到站点速度很慢,用户体验差。
其他文献
我国炼油厂和石油化工厂副产的大量碳四馏分主要被用作工业和民用燃料,以及生产烷基化汽油和叠合汽油,在其化工利用方面远远落后于工业发达国家。以丁烯齐聚为基础生产高附加
交联聚乙烯(XLPE)电力电缆在高压电网中的应用越来越广泛,局部放电是造成电力电缆绝缘层破坏的主要原因,对电缆绝缘层的局部放电进行检测并对局放点定位是及时发现故障隐患,
万维网(World Wide Web)的成功,很大程度上是因为其软件架构的设计满足了Internet规模(Internet-scale)的分布式系统的需求。在过去的10年间,随着网络融合,Web Service和分层
笔者从语文教学的角度出发,着重从四个方面结合自己的教学实际谈在语文教学中如何组织课堂小组进行讨论。从文中论述可知,组织课堂小组讨论可以促进教学效果的提高。
我国的幼儿教育正蓬勃兴起,各种幼教模式百花齐放,一时间,给幼儿什么样的教育才是最好的,成为了人们热议的话题。其实,无论何种方式,都必须将社会规范的接受融入其中,才可能
黎英海——中国当代著名的作曲家、理论家、音乐教育家。作为中国民族多声部音乐理论的缔造者也是践行者、一位划时代的领军人物,他对中国民族调式和声理论的研究,进行了富有
目的:通过对癌症晚期患者的心理护理,结合基本护理和临床治疗,延长患者生存时间。方法:医护人员以疏泄安慰、暗示、死亡教育等手段,指导患者树立正确的疾病观。结果:正确有效
随着技术的进步,手机不仅仅是一种语音通讯工具,同时成为了一种重要的数据处理工具。随着3G时代的来临,手机上的各种应用逐渐出现,其中就包括网络游戏。在PC平台上,网络游戏
随着信息时代的到来,报纸、电视等传统媒体也在形式、内容、受众等各个层面遭受新兴媒体的挑战,而手机正是新兴媒体的典型代表。手机作为一种新兴媒体,从1987年首次在我国出