论文部分内容阅读
云存储系统作为快速存储大数据的一种方式,也是大数据的主要存储平台,其能耗问题已经成为当前大数据应用当中亟待解决的重要问题。云存储系统中数据块副本放置策略,磁盘状态,CPU工作状态等因素均影响其能耗。 本文针对HDFS中默认副本放置策略的局限性,提出HDFS数据块副本优化放置原理,通过引入图的覆盖理论,建立节点和数据块副本之间的关系模型,并推导关闭节点极大值公式和相关定理。本文通过引入多元线性回归方程理论简化磁盘状态概率模型计算磁盘功率,在执行数据密集型任务时计算精度更高,同时提出了基于插值多项式和积分理论计算磁盘能耗的方法。本文针对基于CPU工作状态计算机能耗度量模型在计算精度、异构性方面的不足,提出基于多项式拟合的异构云存储系统能耗度量优化模型,并从理论上提高模型的计算精度。 实验结果表明,简化磁盘状态概率模型具备准确性,在数据密集型任务中,简化后的模型能够比较准确计算磁盘功率。随着磁盘accessing状态概率的增加,简化后的模型与原模型相对误差逐渐变小。Lagrange插值和Riemann积分理论法能够比较准确度量磁盘能耗。基于多项式拟合的异构云存储系统能耗度量优化模型可以比较精确的度量计算机能耗。