基于多种盘阵列的混合存储系统性能优化方法研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:jjaijjai
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术的飞速发展,数据规模不断扩大,各类应用对存储性能的要求也越来越高,传统的存储系统在容量、性能、可靠性等方面面临着巨大的挑战。磁盘阵列(Redundant Array of Independent Disks,RAID)通过并行技术和冗余机制大大提高了存储系统的性能和可靠性,为构建高效高可靠的存储系统提供了一种很好的解决思路。相比于磁盘阵列,固态盘阵列(Redundant Array of Independent SSDs,RAIS)可提供更高的数据访问性能,但存储成本也更高。基于磁盘阵列和固态盘阵列构建的混合存储系统利用固态盘阵列的高性能提供快速的数据访问,利用磁盘阵列提供大容量存储。如何在磁盘阵列和固态盘阵列之间合理分布数据来充分发挥系统内各存储设备的优势,克服盘阵列系统在处理小写请求时频繁更新校验导致的系统性能影响,对于提升系统整体性能有着重要意义。论文从真实负载中的数据访问特性出发,考虑不同类型存储设备之间的差异,降低混合存储系统中盘阵列的校验更新开销,围绕着混合存储系统的性能优化提出了相应方法。针对混合存储系统中分布数据的问题,提出了基于访问顺序性感知的数据布局方法(Sequentiality Aware Data Placement,SADP),将能够带来高性能收益的数据优先分布在性能更高的固态盘阵列上来提高系统整体性能。由于数据的访问类型存在差异,将不同数据存放在固态盘阵列上产生的性能收益差别很大。SADP根据数据的访问特征计算出将数据分布在固态盘阵列上的性能收益值,利用贪心算法优先将能够带来高性能收益的数据(简称高收益数据)存放在固态盘阵列上来获得最大的性能收益。不同于传统方法仅以数据访问频度和请求大小作为数据布局的依据,SADP增加了对数据访问顺序性的考虑,避免将顺序访问数据识别为高收益数据,更好地利用固态盘阵列的性能优势提升系统性能。同时,SADP设计了一种高效的冷热表结构,在O(1)时间复杂度内完成对高收益数据的查找,相比传统的全局查找方式有效提高了数据布局效率。测试表明,SADP比经典的Hystor系统中使用的数据布局方法的系统带宽提高了27.1%,系统平均响应延迟降低了20.7%。针对混合存储系统中校验更新消耗部分固态盘资源导致系统性能提升有限的问题,提出了基于缓存校验提升固态盘资源利用率的方法(Parity Caching based method for improving Utilization of SSD resource,PCUS),利用缓存技术减少校验更新对固态盘资源的消耗。由于小写请求产生的校验更新开销远高于大写请求产生的校验更新开销,PCUS利用新型非易失存储器(Non-Volatile Memory,NVM)作为校验缓存推迟系统内固态盘阵列的校验更新,将一个条带的多次小写聚合成一次大写,降低固态盘阵列的校验更新开销,使得更多的固态盘资源用于系统性能提升。不同于传统缓存方法仅仅通过缓存校验来聚合条带小写,PCUS根据关联数据访问间隔短的特点将关联更新的热数据重组到一个条带,缩短了条带内数据更新间隔,提高了小写聚合成大写的概率,更有效地利用NVM缓存来降低固态盘阵列的校验更新开销和提高固态盘资源的利用率。测试表明,对比使用典型的缓存方法PPC来提高混合存储系统的固态盘资源利用率,PCUS将系统带宽提高了14.9%。针对混合存储系统中校验更新影响数据访问请求处理速度导致系统平均响应延迟增加的问题,提出了面向响应延迟优化重建友好的日志方法(Recovery Friendly Logging method for Latency reduction,RFLL),利用日志技术优化系统平均响应延迟的同时兼顾了重建性能。混合存储系统中磁盘阵列上数据访问请求的响应延迟很高,RFLL将更新数据写到新的条带并重定向校验到一块专门的日志盘,降低了磁盘阵列的校验更新开销,提高了磁盘阵列上数据访问请求的处理速度,降低了系统的平均响应延迟。由于数据的写次数存在不对称性,直接将更新数据以日志方式写到新的条带容易造成新旧数据混杂,大量需要保留的旧数据导致磁盘故障时系统重建时间增加。RFLL在将更新数据写到新条带时避免将来自不同条带的更新数据写到一个条带,降低了新旧数据混杂的概率,减少了需要保留的旧数据个数,提高了重建效率。同时,RFLL利用缓存减少实际写到日志盘的校验量,提高了系统写性能。测试表明,对比使用典型的日志方法EPLOG来优化系统平均响应延迟,RFLL将系统平均响应延迟降低了20.6%,磁盘故障时的重建时间降低了12.5%。
其他文献
本文主要是从欠平衡钻井的概念和优缺点出发,探讨相关井控特征。
北宋是散文创作的繁荣时期,当时有一大批散文作者追随欧阳修、苏轼,创作散文。他们虽然文学成就不及欧、苏,但也是北宋文坛的重要组成部分。毕仲游就是其中之一。毕仲游参加
通过考察100万字的中介语语料库中“N+V+得+A”句,发现韩国、印尼、越南、日本四国学习者习得这一句式均大致经历三个阶段:初级二阶段是萌芽期,这一时期该句式的功能较单一;中级一阶
目的:比较异氟醚与七氟醚对老年人麻醉后苏醒和认知的影响。方法:选取择期行腹部手术的老年患者80例,随机分为异氟醚组(n=40)和七氟醚组(n=40)。记录患者的一般情况;监测手术后苏醒
本文首先对商贸业经济质量变化规律进行理论分析,然后采用因素替换分析方法,对我国及区域现代商贸业的经济质量进行定量评价,并对现代商贸业经济发展的区域特征进行比较。
<正> 东北三省是我国高水分粮比较集中的产区,以玉米、大豆为主,每年由粮食部门收购×××亿公斤左右。收获和收购季节气温较低,这些高水分粮需经人工干燥才能安全储存或长途
目的:研究NF-κB高表达与骨肉瘤预后的关系。方法:应用免疫组化方法检测80例骨肉瘤NF-κBp65的表达。结果:80例骨肉瘤中48例NF-κBp65阳性(60%)。NF-κB的高表达与骨肉瘤肿瘤性骨样组织分型、WHO分型(1993)以及骨肉瘤预后有
非常规油气资源分为非常规石油资源和非常规天然气资源两大类,前者主要包括致密油、页岩油、稠油、油砂、油页岩等,后者主要包括致密气、页岩气、煤层气、甲烷水合物等。我国
<正>食管癌是我国常见恶性肿瘤之一,居恶性肿瘤发病的第2位,病死率占第4位:世界年死亡数约20万例.而我国就占15万(75%).由于各种原因.许多食管癌常被误诊,有资料显示早期诊断率为