论文部分内容阅读
近年来,云计算技术飞速发展,已经广泛应用于诸多领域。云计算环境聚集了大量的物理和虚拟资源,并提供多个层次的服务。云计算环境下各类服务以不同方式部署在节点上。由于云计算服务的多样性以及部署环境的动态性,云计算节点时常会出现异常,且异常通常会转化为严重的故障,造成服务失效、资源浪费,对云计算的可靠性带来严峻挑战。为了保持云计算的高可靠性,越来越多的专家学者将研究重点放在异常检测方面,并提出一些云计算环境下节点异常检测方法。但现有方法存在以下问题:(1)对于基于节点运行数据检测单一节点状态的方法,当节点内部正常的系统事件、资源调用等行为引起的数据变化可能会被检测为异常行为,最终会导致异常检测方法误报率高;(2)由于节点之间数据传输及资源共享等行为,某一节点出现异常可能会导致其它节点也出现异常,现有研究没有考虑到节点异常传播导致关联节点异常等问题。本文针对云计算节点异常检测方法存在的问题,并结合云计算的特点,以提升云计算的可靠性为目的,对节点异常检测方法进行相关研究。本文提出了云计算环境下节点异常检测方法,并对云计算环境下的节点异常进行分析、检测,主要工作包括:(1)结合Agent技术提出了云计算环境下节点异常检测结构,通过该结构建立节点监控模型,节点监控模型模型包括节点运行数据采集、节点关系图建立和节点数据传输。(2)提出了单一节点异常检测方法,首先采用基于时间点的异常检测方法检测节点数据,在出现异常时,再采用基于时间窗口的方法确定节点状态。(3)提出了关联节点异常检测方法,在单一节点异常的情况下通过节点关系图寻找与之关联的其它关联节点,并根据节点不同关联关系使用不同的检测算法,包括直接关联节点异常检测与间接关联节异常检测方法。(4)设计并实现了一个云计算环境下节点异常检测软件原型,通过相关实验验证了论文所提方法的有效性。实验结果表明本文提出的单一节点方法能够过滤噪声的影响,并且具有较低的误报率和较高的正确率;在单一节点异常的情况下,关联节点算法能够找到关联节点异常且具有较高的正确率。