基于数据块级的多层存储调度策略研究

来源 :中南民族大学 | 被引量 : 0次 | 上传用户:vlee46
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
由于全球数据量的呈指数性增长,各大存储服务商担负着巨大的存储压力。分层存储已经成为同时实现高效访问和廉价存储的必要方案。但单一的分层存储系统面临着重复数据的问题,一方面,呈指数增长的重复数据不断降低分层存储系统在效率和成本上的收益,另一方面,目前重复数据删除技术与分层存储技术的简单叠加关系使两者无法充分发挥各自的优势。本文结合分层存储和重复数据删除技术的优点,提出一种基于变长数据块的重复数据感知分层存储模型DAMS。为了进行更有效的缓存替换,我们分析了ARC算法的缺陷,提出一种高效、可变、兼容的缓存替换算法D-ARC,适宜应用在DAMS模型中。作为可行性验证,本文基于DAMS模型实现了一种宜广泛应用的存储系统实例Store X,Store X使用D-ARC进行缓存替换,并在细节技术上有创新实现,如引入数据块长度以降低hash冲突率,联合存储活跃度信息和数据指纹信息以节省空间。最后,通过两个测试工具生成随机数据,在不同参数下对Store X进行全面评估,对D-ARC算法做出对比实验。本文针对高效、大容量存储的需求,进行深入研究,具体工作内容如下。(1)分析数据量过大的问题,归纳该问题的研究现状,总结出增量数据访问局部性、大量重复数据的两个基本特点,以此作为研究的突破点。(2)提出基于变长数据块的重复数据感知分层存储模型DAMS,模型通过桥梁结构结合了分层存储和重复数据删除的优势,对强关联部分进行重叠,是高效、大容量存储的解决方案。(3)提出D-ARC。通过对ARC缓存替换算法进行分析,总结出4个缺陷,D-ARC在保留ARC优势的基础上进行了3方面的改进,在小幅提高效率的前提下,具有更高的命中率、可变性和兼容性。(4)在DAMS模型的基础上,实现了可广泛应用的存储系统实例Store X。Store X使用D-ARC进行数据调度,涉及数据分割、指纹存储等技术的具体实现,并在实现细节进行创新,如引入数据长度以降低hash冲突率、联合存储数据活跃度信息和数据块指纹以充分利用hash表的优势。(5)分析可能的过拟合,实现重复数据生成工具和模拟读取工具,在可控参数的情况下生成随机测试数据,得出对Store X和D-ARC的全面评估。
其他文献
分布式存储系统是网络环境下的数据分布式存储方法,因其适应海量数据的大规模存储,成本低,并具有容错性、可扩展性,被广泛运用在云计算、云存储中。随着攻击者能力的不断提升
商业信用是指上下游企业在商品交易中形成的一种自发性的贷款关系,主要表现为应收账款、预收账款等形式。与企业主要融资方式(银行贷款)受金融机构管制较多不同,商业信用是一
近年来,随着人们对传统历史文化的保护和传承工作越来越重视,研究人员对历史文献数字化研究投入的精力也越来越多。藏族是一个拥有丰富传统文化的民族,是五千年中华文明不可
近年来,随着移动智能设备的普及,移动云计算技术得到飞速发展。目前移动设备访问云资源与固定设备一样,通过网络发送至各级路由到达远程云服务器。然而移动设备和PC机相比具
未来移动通信系统的数据流量将达到现在的千倍以上,为了满足如此高的要求,第五代移动通信系统(5G)将实现密集化部署。这会引起更加严重的干扰问题,如何有效地管理和利用干扰
随着科学技术的发展和人口数量的快速增长,环境污染现象日益严峻,全面治理大气、水、土壤等的污染问题已经刻不容缓。光催化氧化技术可以利用天然太阳能,在常温常压下将污染物彻底矿化成二氧化碳和水,是处理环境污染问题潜在有效的方法,而传统的TiO_2催化剂对可见光的利用率低且催化活性不高。针对上述问题,本论文构建了三种铁酸盐异质结可见光响应型催化剂,利用异质结构促进光生载流子的分离和迁移效率,从而提高光催化
机器人行业中并联机器人的研究越来越受关注,在工业、农业、服务业等产业也是得到了广泛的应用。六自由度并联机器人相比于串联机器人稳定性更好,在航空航天业、工程机械以及娱乐设施等行业都展现出了其独具优势的地位,所以六自由度并联机器人一直都是机器人领域的研究热点。伴随着研究的进一步深入,并联机器人的研究逐渐向高精度和高稳定性的方向发展,应用也是更加广泛。并联机器人包含了各种传感器设备,为了对并联机器人实现
伴随着中国经济的快速发展,人们物质生活的逐步提升,同时人们也越来越追求居住生活周边的生态景观环境。近年来由于中国政府大力推进高速铁路建设,1000公里以内的旅程,人们首
Zen Cart开源电子商务系统是在2003年从成熟的开源框架osCommerce的基础上开发出来的。由于其免费、界面友好和成熟性,及其对安装人员的专业知识要求不高,在世界上有广泛的应
在互联网飞速发展的今天,各种新型的网络应用层出不穷。人们对网络的服务质量(QoS)要求越来越高,要求网络传输时延更小,网络吞吐量更高等,而这些要求正与网络拥塞问题相矛盾