论文部分内容阅读
虚拟机迁移作为有效的管理手段被广泛应用于云数据中心,特别是动态迁移技术,其在硬件维护、负载均衡、服务器整合、能耗优化和跨站管理等方面发挥了极其重要的作用。而相关研究中大多都积极地致力于通过虚拟机整合来降低数据中心的能耗,忽略了保证用户服务质量的迁移因子,特别是用户访问虚拟机服务时的访问延迟。访问延迟是现代跨地理区域服务的云数据中心内衡量云服务质量的重要指标,会直接影响到云服务商的市场拓展。因此本文以保证用户的服务质量为迁移因子,以降低用户的访问延迟为目标,从三方面展开研究。
首先,部署于云中的虚拟机通过云数据中心的域间网络向全球不同地域的在线用户提供服务,考虑到其在线用户在云中的分布变化可能会导致访问延迟增大的问题,本文对虚拟机的在线用户分布变化和延迟计算问题进行了分析和建模,并提出了结合简单线性回归(Simple Linear Regression, SLR)和用户分布感知重部署算法(User Distribution Aware Redeployment, DARD)的在线用户访问延迟优化的虚拟机重部署方案SLR-DARD。方案基于简单线性回归对未来用户分布进行预测再通过DARD算法求解最优部署节点来降低在线用户的访问延迟并克服已有研究中只基于DARD算法的方案会导致多次不必要迁移的缺点。实验部分,本文通过统计三个真实社交应用公开的用户签到记录仿真了虚拟机在云中的在线用户分布变化,并基于统计结果对无迁移、DARD和SLR-DARD三种重部署方案进行了仿真实验对比。结果表明在本文的设定下,SLR-DARD方案不仅可降低20%左右的总访问延迟,还极大地减少了DARD算法导致的不必要迁移次数,最高达98.6%。
其次,重部署方案旨在为在线用户分布不合理的虚拟机选择最优重部署的数据中心节点,在确定目的节点后,宿主机的选择则为下一步需要解决的问题,而解决问题的关键在于准确评估主机资源占用,即准确评估虚拟机所需资源与宿主机剩余资源。主机负载预测方法可对主机未来资源占用进行估计,但已有研究中的预测模型多基于传统机器学习方法而很难充分利用负载记录的时序特征。因此本文基于深度学习方法提出一种卷积网络CNN和长短期记忆网络LSTM相结合的网络模型CNN-LSTM来对主机负载进行预测。模型中的卷积结构被用来对负载记录进行初级的特征提取,LSTM结构被用来处理负载记录中的时间特征,并增加了融合模块将初步结果与历史记录中当前时刻后的记录相融合再输出预测结果。实验部分,本文基于Azure和Alibaba的真实负载跟踪数据集将CNN-LSTM模型与相关研究中的三类预测模型进行了对比,实验结果验证了本文模型在负载预测问题上的准确性。并且考虑到传统固定阈值方法的缺陷,本文还提出以预测结果的平均值与标准差之和来代表主机资源占用的动态资源测度方法。
最后,软件定义网络作为新型网络技术已被广泛应用于云数据中心,由于其中心化和控制平面的网络抽象使得云中的访问流量更加透明,且基于其南北向接口能更容易实现对研究中所需统计数据如用户分布、访问延迟和历史负载的收集以及迁移控制等等。因此,本文中阐述了SDN的特性、体系架构及云数据中心的SDN网络架构中的相关组件及其功能,而后基于前文研究和SDN网络架构提出了云数据中心下在线用户访问延迟优化的动态迁移机制,并详细介绍了迁移机制在SDN网络架构下的4个关键阶段的设计。迁移机制的实验分为重部署方案和宿主机选择方案两部分并基于CloudSimSDN框架进行仿真实现,且皆从平均访问响应时间和总能耗两方面对方案性能进行了评估和分析。
首先,部署于云中的虚拟机通过云数据中心的域间网络向全球不同地域的在线用户提供服务,考虑到其在线用户在云中的分布变化可能会导致访问延迟增大的问题,本文对虚拟机的在线用户分布变化和延迟计算问题进行了分析和建模,并提出了结合简单线性回归(Simple Linear Regression, SLR)和用户分布感知重部署算法(User Distribution Aware Redeployment, DARD)的在线用户访问延迟优化的虚拟机重部署方案SLR-DARD。方案基于简单线性回归对未来用户分布进行预测再通过DARD算法求解最优部署节点来降低在线用户的访问延迟并克服已有研究中只基于DARD算法的方案会导致多次不必要迁移的缺点。实验部分,本文通过统计三个真实社交应用公开的用户签到记录仿真了虚拟机在云中的在线用户分布变化,并基于统计结果对无迁移、DARD和SLR-DARD三种重部署方案进行了仿真实验对比。结果表明在本文的设定下,SLR-DARD方案不仅可降低20%左右的总访问延迟,还极大地减少了DARD算法导致的不必要迁移次数,最高达98.6%。
其次,重部署方案旨在为在线用户分布不合理的虚拟机选择最优重部署的数据中心节点,在确定目的节点后,宿主机的选择则为下一步需要解决的问题,而解决问题的关键在于准确评估主机资源占用,即准确评估虚拟机所需资源与宿主机剩余资源。主机负载预测方法可对主机未来资源占用进行估计,但已有研究中的预测模型多基于传统机器学习方法而很难充分利用负载记录的时序特征。因此本文基于深度学习方法提出一种卷积网络CNN和长短期记忆网络LSTM相结合的网络模型CNN-LSTM来对主机负载进行预测。模型中的卷积结构被用来对负载记录进行初级的特征提取,LSTM结构被用来处理负载记录中的时间特征,并增加了融合模块将初步结果与历史记录中当前时刻后的记录相融合再输出预测结果。实验部分,本文基于Azure和Alibaba的真实负载跟踪数据集将CNN-LSTM模型与相关研究中的三类预测模型进行了对比,实验结果验证了本文模型在负载预测问题上的准确性。并且考虑到传统固定阈值方法的缺陷,本文还提出以预测结果的平均值与标准差之和来代表主机资源占用的动态资源测度方法。
最后,软件定义网络作为新型网络技术已被广泛应用于云数据中心,由于其中心化和控制平面的网络抽象使得云中的访问流量更加透明,且基于其南北向接口能更容易实现对研究中所需统计数据如用户分布、访问延迟和历史负载的收集以及迁移控制等等。因此,本文中阐述了SDN的特性、体系架构及云数据中心的SDN网络架构中的相关组件及其功能,而后基于前文研究和SDN网络架构提出了云数据中心下在线用户访问延迟优化的动态迁移机制,并详细介绍了迁移机制在SDN网络架构下的4个关键阶段的设计。迁移机制的实验分为重部署方案和宿主机选择方案两部分并基于CloudSimSDN框架进行仿真实现,且皆从平均访问响应时间和总能耗两方面对方案性能进行了评估和分析。