分布式文件系统元数据高效索引机制设计与实现

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:WANGYUEWANG
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着数据量呈爆炸式的增长,文件系统的规模也在不断膨胀,系统中文件数量达到千万甚至上亿,分布式文件系统能很好的解决大规模文件存储的问题,如Google的GFS(Google File System)文件系统等。文件系统中文件元数据是描述文件基本特征的数据,文件系统管理员和用户都需要通过文件元数据来快速定位需要的文件,如何组织和索引分布式文件系统的海量元数据是一项亟待解决的问题。为了解决文件系统海量元数据高效访问与查找的问题,在分析了元数据访问、查找、分布特性的基础上,给出一种分布式文件系统元数据组织与索引方法,该方法考虑文件系统元数据查找功能,将文件元数据根据目录树进行层次性分区组织,并将每个分区的元数据顺序存储到磁盘;采用布隆过滤器(Bloom Filter)为每个分区建立目录表用于快速过滤与查找不相关的分区;借助多维检索树(K-D树)为分区建立内存索引以支持多维元数据属性的查找;建立更新日志保存元数据的更新,将元数据更新实时同步到索引以满足实时查找的需求,并周期性的同步到磁盘。基于上述方法,设计并实现了分布式网络文件系统(Distributed File System,DNFS)的元数据管理模块原型Mspy(Metadata Spy),并对其进行实验评估。实验证明,Mspy的元数据查找效率比传统方式提高3-8倍,使得文件系统大部分的元数据查找操作能在1秒内完成。
其他文献
在计算机系统中,存储子系统的能耗占着相当大的比例。降低存储子系统能耗成为计算机系统节能的一条重要途径。利用组合盘(由固态盘和硬盘构成)进行节能是近年来的一个研究热点
闪存(Flash Memory)是嵌入式系统中一种常用的存储介质,具有体积小、容量大、成本低等一系列优点。它最早为人所知是通过U盘的普及。现在,随着手机、数码相机、PDA、便携式游
无线传感网是最近几年研究很热的一个领域,它被公认为是继互联网之后的第二大网络,而无线传感网的特点决定了它对防危性有很高的要求,即无线传感网的良好应用需要防危性的保
三维视频以其真实、自然以及广泛的应用前景,在三维电影、电视、视频会议以及军事、医疗等方面均有广泛的应用。但三维视频庞大的数据量,使其在存储、处理及传输方面对系统要
无线传感网络(Wireless sensor network, WSN)为人们提供了新的感知物理环境的手段,如何从其产生的数据流中识别出有意义的数据和事件并加以处理已经成为了当前研究的热点。复杂
随着科技的快速发展,人们社会活动趋于频繁,对稳定、快速、准确的个人身份验证和查询的需求变得越来越大;但目前人证同一性验证普遍存在验证效率低、精度差、信息使用不充分等问
乳腺癌作为中老年女性的致命肿瘤之一,早期检测、早期治疗是降低乳腺癌死亡率的关键。乳腺X线摄影是公认的诊断早期乳腺癌的方法,但医生阅读乳腺X射线片图像是一个耗时耗力的工
目前虚拟化技术的研究工作主要集中在各种主流硬件的虚拟化,虚拟机网络带宽分配方面的研究工作比较少。如果虚拟机的网络带宽无法根据应用的需求进行必要的控制,相互的带宽争用
随着互联网技术的不断发展,信息交换和传播的方式也越来越多样化,对于企业来说,需要及时获知网络上与自身有关的敏感信息。“网络敏感信息实时预警系统”是针对企业需求开发
肺结节分割是计算机辅助诊断肺结节的关键步骤,其准确性关系到后续的结节量化和诊断结论的可信性。目前没有一种分割算法能完全准确地将肺结节从肺CT图像中分割出来,因此提出实