基于数据挖掘算法的日志分析系统的设计与实现

来源 :青岛大学 | 被引量 : 0次 | 上传用户:qq343246680
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着数据采集和存储技术的飞速发展,很多领域都积累了大量的数据。为了从数据中发现有价值的知识和规律,人们结合数据库、统计学及机器学习等技术,提出数据挖掘来解决这一难题。聚类分析技术是数据挖掘中的经典内容,是各学科研究的重要工具。本文对数据挖掘技术,尤其是聚类分析进行了较为系统地分析和研究,主要包括以下一些内容:(1)数据挖掘技术的概述。介绍了数据挖掘的基本概念、分类、主要功能、关键技术以及典型应用等等。(2)聚类分析的综述。本文对数据挖掘领域的聚类分析方法及代表算法进行了分析,提出了数据挖掘对聚类的典型要求,并基于这些要求对数据挖掘中常用的聚类算法作了比较,以便于人们更容易、更快速地选择一种适用于具体问题的聚类算法。(3)数据挖掘在实际项目中的应用。根据实际项目开发中遇到的问题,设计了日志分析系统。通过相关算法,对J2EE应用程序产生的日志进行分析,获得有价值的信息:通过日志分析系统提供的查询功能,开发人员可以快速的定位异常,提高效率,降低维护成本;通过日志分析系统可以发现“异常高发”的程序模块,还可以发现生产环境下用户操作与异常之间的关系,有助于找到某些隐藏的很深的bug,提高程序的稳定性;通过日志分析系统,可以在一定程度上实现系统健康预警的功能。日志分析系统初始版本已经在日常的技术支持中使用。本文从系统的体系结构、功能设计、模块划分、实现技术等方面进行了详细的分析和讨论,并展示了部分已经实现的功能。
其他文献
在物理教学的过程中,培养和激发学生的学习动机不只是取得优异成绩的重要保证,同时也是培养学生情感态度和价值观的重要方法,在教育中具有永久的魅力。本文从动机的基本理论
农业保险政策改革是美国2014年新农业法案中的重要议题。美国通过增加保险品种、提高保险金额、扩大保险覆盖面等多种措施构建更为健全、更能适应农业发展新要求的农业保险体
目的:研究高脂饮食对大鼠、一次性运动和长期运动对肥胖大鼠脂肪组织HSL活性、蛋白及基因表达,perilipin蛋白和基因表达,PPAR-γ基因表达以及血脂、体重等的影响。方法:将116
目的:评价脑出血内、外科治疗的安全性及有效性。方法:遵循循证医学的原则,运用cochrane系统评价的方法,采用计算机检索和手工检索相结合的方法,检索1960年至2008年12月期间M
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技
自我控制是自我意识的核心成分,也是自我的主要执行功能,它能够引发或制止特定的行为,包括抑制冲动、抵制诱惑、延缓满足、制定和完成行为计划、采取适应于社会情景的行为方