论文部分内容阅读
再生码应用于分布式存储系统,分布式存储系统指的是,运用一定的技术手段,将原始数据分别存储在相互独立的若干台设备(节点)上,常通过将冗余添加到单个不可靠数据节点的方式来提供可靠的访问,应用场景包括数据中心、点对点存储系统和无线网络中的存储.早期,人们采用复制的方式来保持数据的稳定性,后由于复制整体数据会产生过高的存储成本,开始考虑精确地修复某一个失效节点上的信息,即精确修复问题,.当某个节点失效时,系统执行的修复任务依赖于单个节点之间的通信,这对于码的设计来说是一个新的挑战.特别是一个与系统整体效率有关的新参数一一修复带宽,即在修复故障节点的过程中节点之间通信的数据量.首先考虑的编码技术是用纠删码来修复失效节点,信息,然而纠删码的修复过程仅为了生成一个编码块需要重建新节点的整个编码数据,这样的方法显然是次优的.2010年,Dimakis等人首次提出了再生码的概念,再生码是能够提供有效修复的编码解决方式,自再生码的概念被提出,再生码就一直是当前研究的一个焦点.再生码允许新节点通过存活节点存储倍息之间的计算来修复失效节点,其在减小修复带宽上起了很大的作用,并且可以在存储和修复带宽之间达到一个良性平衡.2016年,Venkatesan Guruswami等人解决了RS码在分布式存储系统中的精确修复问题,但是其线性修复方案中码长受到字符集的限制,为了改善这一问题,金玲飞等人用代数几何码构造出再生码提高修复效率,解决节点修复问题.针对由RS码或者代数几何码构造的再生码无法确定是否能够达到割集界的问题,本文受到Itzhak Tamo等人研究结果的启发,通过域E上的有理代数几何码的一个特殊的子族构造出有理代数几何码的修复方案,使其修复单个失效节点的同时达到割集界.但这个方案能够修复的节点限制在一定范围内,为了改善这个问题,本文又在域扩张塔上构造出有理代数几何码的一个修复方案,使其可以对任意一个单个失效节点进行修复,并达到割集界.除了构造出最优修复的有理代数几何再生码,本文还对金玲飞等人构造的一般代数几何再生码进行了一些改进,通过对修复方案中某一函数的参数进行调整,突破了原方案中仅允许有限域的特征为偶数这一限制,并证明在新的函数下修复方案的带宽仍然达到最优.本文研究的几个问题分别是:(1)解决代数几何码构造的再生码不确定能否达到割集界的问题.针对这个问题本文并没有完全解决,但是本文中构造了有理函数域上代数几何再生码修复方案,使其能够修复单个失效节点并达到割集界.主要是通过E上的有理代数几何码的一个特殊的子族构造出有理代数几何码的修复方案,即这个修复方案构造在E的子域Fi上,使得修复某一个失效节点Ci时,只需要访问Fi中di个元素,且每个元素只需要访问1/pi的内容,以此来减小修复带宽并达到割集界.(2)针对(1)中存在修复节点限制在某个范围内的问题,构造一个修复方案不但能够修复单个失效节点并达到割集界,还可以修复任意一个失效节点的信息.主要方法是构造一个基础的域塔,通过在中间域Fi上构造一个子空间Si,使得从d个帮助节点下载Fi中pi个符号的1/s来修复任意一个单个失效节点.(3)对于金玲飞等人的代数几何码的修复方案中存在的有限域特征被限制为偶数的问题,本文通过对修复方案中某一函数的参数值的修正,得出该修复方案可以在有限域特征为任意值的前提下,也可以修复单个失效节点,并同样达到最优修复带宽.本文整体分为三章内容:(1)第一章主要介绍了再生码的由来及其概念,不但对再生码作出了通俗文字上的解释,还给出了数学语言上的再生码的定义.(2)第二章第一节介绍了代数函数域和代数几何码的基本概念,以供后文使用.第二节构造了有理代数几何码的修复方案,并基于方案中修复的失效节点所受到的限制做出进一步调整,给出另一可以修复任意单个节点的修复方案.(3)第三章第一节对金玲飞等人构造的再生码修复方案进行改进,经过改进,可以证明有限域的特征既可以是偶素数,也可以是奇素数,并且修复方案同样可以达到最优修复带宽.第二节基于第一节中一般代数几何再生码的修复方案,做出由Hermite码得到的再生码,并证明可以达到最优修复带宽。