分布式键值存储系统的设计与实现

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:yanlingyanling
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网高速发展,移动互联网浪潮的兴起,人们的生活越来越离不开互联网,人们在使用互联网进行互联的同时创造的数据量也是呈指数级增长,提高对海量数据的存储和快速访问的需求变得越来越迫切。海量数据对传统的单机文件存储系统提出了巨大挑战,传统的存储系统不能为应用提供灵活的可扩展性,难以做到线性扩展。移动互联网浪潮下创建一种新型的对非结构化数据存储、具有高扩展性的键值存储系统开始变得尤为迫切。本文提出一种分布式键值存储系统,该系统在架构上考虑到高扩展性,系统接入层统一进行接入,通过哈希算法来提高数据的寻址效率,为了提高系统的数据访问效率,系统在数据存储层上构建了缓存层,通过路由协议让系统具备良好的伸缩性,对数据进行迁移的过程中不影响分布式存储对外提供服务,存储节点的变化对用户使用系统透明。本文对现有成熟并且已经运用于生产环境中的分布式存储技术进行了全面系统的分析,在分析不同存储系统优劣势的基础上提出了本文的分布式键值存储系统。本文的主要设计思想或创新点主要包括:第一,基于哈希算法和路由协议来解决数据和存储节点之间的映射关系,构建满足如今移动互联网海量碎片化数据的分布式键值存储系统,依据这样的映射策略系统能够非常方便的进行透明的动态扩缩容操作,具备良好的可扩展性。第二,存储系统对数据透明存储,存储系统和数据进行了彻底的解耦,提高了存储系统的通用性,从用户的角度看到其所用的存储系统就是一个海量的数据存储中心。基于KV键值对的形式来设计数据存储结构,所有的数据都以二进制非结构化的形式进行存储,与传统的关系型数据存储系统对比,其数据存储简单、高效,让用户能更加灵活的使用存储系统。第三,分布式存储系统中数据具备高可靠性,同时数据访问具有低延迟性。在可靠性方面,系统采用多副本的方式保证数据的多地备份;为了保证数据的低延迟访问,采用分布式缓存来缓存全量数据;同时为了保证数据存储和数据缓存的全量数据同步,构建了一个分布式消息队列作为同步层,解耦数据存储层和数据缓存层之间的依赖关系,使之能够随意扩展多个数据缓存层以提供用户的就近接入。本论文提出了一种将传统数据存储和大数据背景下产生的键值数据存储理论相结合的方式来提供海量数据存储的解决方案,对分布式键值存储系统的发展具有一定的探索和实践意义。
其他文献
随着Web Service在电子商务和企业联盟中应用的日益广泛,安全性问题越来越重要,已经成为制约其进一步发展的关键因素之一。信息安全的主要目标包括机密性、完整性、认证、授
随着信息交换需求迅速增长,交换信息容量的巨增,系统内部上下级数据库之间的数据传输和不同系统之间的数据交换已成为信息系统发展的一个瓶颈。针对这种现代大型网络信息系统
柔性管的形变建模与仿真在工业产品开发、虚拟手术以及计算机动画等领域都有广泛的应用,是CAD与图形学中非常重要的研究课题。目前,基于几何的形变技术已经发展得相对成熟,但
基因组重构是改变基因在基因组中排列顺序的生物过程,可归结为三种主要操作:移位、反转和转位。重组距离即从一个基因组转化为另一个基因组所需的最少重组次数。双重基因组中每
随着经济全球化和信息技术的发展,针对市场机遇,多个企业为了实现共同的项目目标,以契约方式组成一种网络式的联合体,共同承担项目工作,以减少项目的成本和风险,实现优势互补,提高企
随着数字化进程的日益加深,信息家电作为一个新兴的产业日益被广大家庭认识并接受。嵌入式、网络化的发展与普及也为信息家电的发展奠定了良好的基础。然而目前,信息家电的标准还未规范,已有的各类标准缺乏兼容性,安全作为其中的一个研究内容更是没有得到统一。因此,用户身份认证和消息保密机制作为安全研究必不可少的内容,研究意义十分重要。信息家电的安全问题主要体现在:身份认证、数据的保密性、数据的完整性、不可抵赖性
无线传感器网络(Wireless Sensor Network,WSN)是由大量分布的不同规格和功能的具有感知、计算和通信能力的微型传感器节点通过自组织的方式构成的一个小范围的无线网络。大量
传统的文本分类方法大都采用了基于词频的统计方法来表征文本,基于关键词加权重的向量空间模型(Vector Space Model,VSM)对文本进行分类,普遍缺乏语义信息的导引,得到的文档
位姿参量是反映空间中物体运动状况的核心参数,对于军事、导航、航天、航空等众多领域的发展都至关重要。考虑到硬件设施、经济因素等一些实际条件的限制,利用光学设备拍摄的
随着P2P技术的发展,对P2P网络的管理成为了P2P领域的重要问题。如何减少网络带宽的消耗是P2P网络管理中研究的热点之一。P2P网络的管理涉及P2P网络的组织结构、节点间的通信