论文部分内容阅读
随着互联网用户的剧增和宽带网络的普及,数据在人们生产生活中扮演着越来越重要的角色,互联网服务逐渐成为以海量数据处理为中心的服务,其服务质量在很大程度上依赖于对所提供数据处理的能力,数据密集型计算应运而生。副本技术是数据密集型应用中的一项关键技术,它不仅可以提高数据密集型环境中数据的可靠性,还可以有效降低数据的网络访问延迟,提高网络的负载均衡。因而对副本管理机制进行优化是提高数据密集型应用服务质量QoS的一种有效途径。本文在对数据密集型环境中数据副本管理机制研究分析的基础上,结合国内外研究现状及实际应用,对副本管理中的副本选择和副本替换两个方面进行了深入的研究,并提出了相应的优化策略,主要包括以下两个方面的工作:(1)副本选择策略优化:针对云计算这一数据密集型计算的商业化特点,基于带权重的集合覆盖问题(WSCP),提出一种具有成本感知功能的副本选择策略,使得在选择低成本数据副本的同时减小副本传输时间,从而提高云环境中数据密集型应用程序的效率;对云仿真器CloudSim进行数据传输和动态带宽两方面的扩展,并在扩展的云仿真器CloudSim中对提出的策略进行了有效性验证。(2)副本替换策略优化:通过对数据密集型环境中传统的副本替换算法的研究分析,针对LRU策略在顺序访问模式下性能不足的问题及传统策略的不足,将美国俄亥俄州立大学讲席教授张晓东博士提出的LIRS(Low Inter-reference Recency)替换算法应用到副本替换中,然后对模拟器OptorSim进行扩展,实现了一种基于LIRS的副本替换策略,并在不同的调度策略和访问模式下将该策略与其他的策略(LRU、MRU、LFU和MFU)进行了全面的比较。总之,本文在分析研究数据副本管理机制的基础上,对副本管理中的副本选择和副本替换分别进行了优化,并在相应的模拟器中进行了实验仿真,实验表明本文提出的策略在某些方面具有一定的优越性。