论文部分内容阅读
在线服务系统需要实时接受并处理大量的用户请求,各种原因的错误都可能导致用户的请求失败。由于在线服务系统的请求数量多,产生的日志数据量大,传统使用人工方法进行请求失败原因的分析、统计和管理的工作量巨大。提出了一种基于聚类算法的自动化故障诊断与错误管理方法,通过自动分析在线服务系统自身产生的日志,对用户的失败请求进行归类,帮助程序开发人员和系统管理员进行错误管理,并了解各种失败请求的类别、分布和趋势。同时,使用投票机制自动将每一类错误定位到其所在的源码位置,实现软件缺陷和问题的快速定位。基于该方法实现了一个自