论文部分内容阅读
随着云计算技术的不断发展和完善,虚拟化技术已成为未来网络发展的核心特征之一,越来越多的业务和服务将被部署到云平台上。虚拟机作为云平台的主要载体,为业务和服务提供存储、计算等各类资源,但由于虚拟机部署在物理平台上共享基础物理资源,各个虚拟机之间存在资源竞争的关系,所以导致虚拟机容易出现异常状态。然而,由于云计算环境下大规模虚拟机的部署使得其本身具有高动态性、数据规模大等特性,使得传统的虚拟机异常行为检测方法不能适应虚拟化结构下的云计算环境。本文在考虑到现阶段虚拟机异常行为检测方法的局限性,对虚拟机的异常行为检测展开相关研究工作,分析和总结了现阶段传统的异常检测方法的优缺点,在此基础上,根据虚拟环境的特性,设计了一套虚拟机异常检测系统,提出自适应周期性数据传输策略解决虚拟机性能数据传输的问题,并提出虚拟机运行环境聚类算法,将具有相似运行环境的虚拟机放在同一集群中进行检测,并结合基于上下文的虚拟机异常检测方法,对被监控虚拟机的运行状态进行检测判断。解决了现阶段虚拟机异常检测存在的精确率低、误报率高等问题。本文完成的工作如下:(1)通过研究虚拟机工作模式下的资源可用性,提出了虚拟机异常检测的系统框架,并对整体检测的流程做出了详细的说明。(2)在传统数据传输方式中,是采用固定时间间隔进行数据传输操作,而这不能适应虚拟环境下高动态的要求,所以本文提出了自适应周期性数据传输策略,通过设定阈值来判断虚拟机性能波动,进而动态调整数据传输的时间间隔,有效解决了传统数据传输方式中无法感知被监控虚拟机性能指标数据变化波动的问题。(3)针对传统异常检测方法不能很好适应虚拟化环境下多节点的异常检测问题,本文提出了虚拟机运行环境聚类算法以及基于上下文的虚拟机异常数据流检测方法,首先将具有相似运行环境的虚拟机放到同一集群中进行检测,接着通过PCA对原始数据集进行数据处理降维,结合节点间的上下文信息判断虚拟机是否出现异常数据流。(4)根据上述工作,在实验中通过故障注入的方式,验证了本文方法在CPU故障、内存故障、I/O故障三种状况下的精确率和召回率,并结合其他两种异常检测方法进行对比,发现该方法在虚拟机异常检测方面具有较高的有效性。