论文部分内容阅读
基础设施即服务(Infrastructure as a Service,Iaa S)是云计算的三种服务模式之一。依托于虚拟化技术,Iaa S服务提供商以虚拟机的形式,为用户提供计算和存储等资源。在虚拟机的租赁期内,其响应时间、吞吐率、可靠性、可用性等服务质量(Quality of Service,QoS)指标通过服务提供商与多个用户之间所签订的服务等级协议(Service Level Agreement,SLA)来保证。任何违反SLA的行为,都会给服务提供商带来经济或名誉方面的损失。准确预测虚拟机的QoS,并根据预测结果及时采取相应的措施,是保证达成SLA的一种主要方式。因此,本文的研究旨在预测虚拟机的响应时间、吞吐率等一些易于量化的QoS指标,从而避免SLA违规行为的发生、优化资源分配。然而,预测虚拟机的QoS时存在一些困难和挑战,主要包括:(1)虚拟机的CPU、内存、I/O等组件的性能下降无法被直接观测,导致虚拟机整体及各组件的性能下降程度难以被准确评估,而这些性能下降的评估结果是影响虚拟机QoS的底层环境特征之一。(2)影响虚拟机QoS的底层环境特征主要包括软硬件特征、配置特征、以及运行时环境特征。然而,各个特征对不同QoS指标的影响程度具有差异性,且同一个特征对不同QoS指标的影响程度也不相同。只有有效分析及量化了这些特征之间,以及特征及QoS之间的关系,才能使得QoS的预测结果更为准确。(3)虚拟机所在环境的改变,会导致虚拟机对应的QoS值发生变化,而静态的预测模型难以捕捉这种特征的动态变化对QoS的影响。贝叶斯网(Bayesian Network,BN)是一种表达多个随机变量之间不确定性依赖关系的概率图模型,它通过有向无环图(Directed Acyclic Graph,DAG)来直观描述多个变量之间的依赖关系,并使用条件概率表(Conditional Probability Table,CPT)来量化依赖关系的程度。因此,针对上述困难和挑战,本文基于BN,在有效分析影响虚拟机QoS的底层环境特征之间存在的不确定性依赖关系,并合理量化这种依赖对QoS影响程度的前提下,本文首先有效评估了虚拟机各组件及虚拟机整体的性能下降程度;然后结合性能下降的评估结果和其他底层环境特征,建立模型并实现了QoS的准确预测;最后基于迁移学习方法,动态更新了QoS预测模型。下面具体阐述本文的研究工作。?为了克服CPU、内存、I/O等组件的性能下降无法被直接观测的困难,本文在BN中引入隐变量。用隐变量来描述无法被直接观测的特征,并通过隐变量与其他变量之间的有向边来表达它们之间存在的依赖关系,从而构建含隐变量的“虚拟机特征-性能”BN(Virtual machine features and Performance Bayesian Network,VPBN),并结合BN的推理算法实现对虚拟机CPU、内存、I/O等组件性能下降的评估,进而根据各组件的性能下降情况来评估虚拟机整体性能下降的程度。实验结果验证了VPBN在评估虚拟机整体及各组件性能下降时的有效性。该研究在BN中引入隐变量,有效挖掘了虚拟机底层环境特征与CPU等组件性能之间的依赖关系。利用BN的概率推理算法计算虚拟机特征与性能之间的依赖程度,可以推测得到各组件的性能下降程度,也提高了VPBN模型的可解释性。?为了有效分析并量化影响虚拟机QoS的底层环境特征之间、以及特征与QoS之间存在的不确定性依赖关系,同时克服基于BN无法预测训练集中未出现过的特征组合所对应QoS的困难,本文在BN中引入XGboost分类器,将多个虚拟机特征分组,并在各个特征组中采用XGboost对不同特征配置分类后,基于分类结果及其对应的QoS值,构建带分类参数的增广BN(Class-parameter augmented BN,CBN)模型。当给定一组QoS待预测的虚拟机特征配置时,基于用于BN精确推理的变量消元算法(Variable Elimination,VE)来实现QoS的准确预测。实验结果验证了CBN在准确预测虚拟机QoS时的有效性,以及XGboost在进行虚拟机特征配置分类时的准确性。该研究通过将XGboost分类器引入BN,克服了BN中由于特征取值过多而导致各个节点的CPT出现的组合爆炸问题,且有效避免了由于CPT中未包含某些虚拟机特征及相应的QoS所对应的条件概率而导致的QoS无法预测的情况。?为了刻画动态变化的环境对QoS的影响,本文结合迁移学习的思想,提出了动态更新CBN结构和参数的方法(称为CBNtransfer)。CBNtransfer结合了Boosting的思想和原有CBN中的知识,利用前向采样法模拟了一部分符合原有CBN结构和参数的数据实例,进而结合新增实例与权值更新函数,动态改变了每一条实例的权值。当虚拟化环境特征发生改变时,根据带权数据实例动态更新CBN的结构和参数,从而有效预测新环境中虚拟机的QoS值。实验结果验证了CBNtransfer在更新CBN参数和结构时的高效性、以及基于更新后的CBN动态预测QoS时的准确性。该研究利用基于实例的迁移学习方法,从原有的QoS预测任务中找到与新增预测任务相似的数据实例,从而利用原有知识来辅助新环境下虚拟机QoS的预测,有效降低了CBN模型重构时时间与计算资源的开销。