论文部分内容阅读
在存储系统中,可靠性是关键问题之一,保障数据的可用性必须要求存储系统提供多种方式来实现高可靠性。本文在仔细分析目前常见的海量存储系统结构的基础上,对系统层面的可靠性进行了探讨;对NAS和SAN的结构进行了分析并讨论了NAS和SAN的可靠性设计方案。随后详细的讨论了存储系统存取控制层实现可靠性的保障手段,分析了磁盘阵列各类级别的可靠性数学模型,进而对多盘故障恢复编码方案进行了研究。 将编码技术应用在磁盘容错上,特别是磁盘阵列中,有助于提高存储系统的容错性。文中对目前提出的EVENODD、XCODE、HOVER、RS编解码进行了详细的研究分析,着重对RS码的纠错方法进行了研究并进行改进后将之应用在磁盘阵列中并通过软件方法实现,其有效地提高了存取速度并发现了在进行大块数据传输时该编码方案出现的瓶颈问题。然后对多盘容错问题提出了新的思路,提出了通过变换步长来达到多盘容错的可能性.由此又探讨了将最近出现的用于网络传输可靠恢复的Tornado码用于磁盘故障恢复中的可能性,通过对TORNADO码的编解码过程的详尽讨论,分析了该码用于磁盘阵列中的优越性,并在文中从理论上提出了该码用在磁盘阵列中的问题,指出了该码的高效的实时性和准确性,可以保障在阵列系统中的磁盘故障快速恢复和数据重建等,从而为存储系统的可靠性又提供了一条新的路径。