云环境下海量小文件存储性能的研究与优化

来源 :电子科技大学 | 被引量 : 2次 | 上传用户:zhulong22
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
如今人们已经进入云时代,该环境下存储文件与用户数据呈现快速上升趋势,云存储的重要性也日益凸显。基于云理念下面向保存海量数据而制定的一种解决方案,被称作云存储,云存储技术的关键在于运用集群技术、分布式文件系统在云端集中管理散落在网络上的存储资源,以满足云环境下数据的存储需求。大数据存储技术中应用范围最广且最成熟的为HDFS系统,基于HDFS自身存储机制,在处理大量小文件时,面临名字节点内存较小等问题。因此,通过HDFS系统上的优化策略读取与文件存储技术分析,在探讨处理大数据处理、海量小文件方面具有一定现实意义。以下为本文完成的工作内容:(1)本文提出PS文件合并算法,本算法主要用于存储海量小文件方面,可以达到数据块与文件关联关系的相互平衡,组合多个小文件为大文件后在HDFS系统上保存,合并所有文件信息后保存在Redis内,利用本算法可以最大限度的使用较少的数据保存信息。基于本算法建立HMM中间层对海量小文件处理,获取HDFS上数据过程中采用缓存方式使得读取信息效率更高。(2)基于Hadoop的分布式文件系统框架,根据小文件上的扩展名分为不同类型进行处理,完成后再组合为一个大文件,从而消耗NameNode内存量下降。(3)通过结合最近最少使用算法、最不经常使用算法,在某段时间内对频率较高的文件合并进行读取,然后再存储至缓存与文件预期中,用户发送读取预取请求与缓存文件后,无需与NameNode之间进行数据交互,可对小文件读取,读取文件效率与速度更快。(4)深入研究操作海量小文件存储平台上的用户,并对用户使用的功能需求总结,基于开源的Hadoop框架对开发环境部署,从数据资源文件数量、体积及非结构化程度等方面出发,结合Redis内存型数据库与MySQL关系型数据库,共同创建云存储平台。
其他文献
亨利·詹姆斯(Henry James)为文学艺术做出了巨大贡献,尤其是其心理现实主义小说,值得大家重读。他的一些作品受到国内外评论家们的广泛关注,例如他的《一位女士的画像》、《
提出了胶囊-水泥浆-聚氨酯联合带压注浆封孔测压技术。该技术利用膨胀胶囊对钻孔初步密封,形成测压气室;在孔口用聚氨酯进一步封堵,然后在膨胀胶囊和聚氨酯封孔段之间进行带
现有载荷谱编谱方法,只是编制机车结构在试验线路所受载荷谱。当机车在其他线路运行时,使用试验线路载荷谱对结构进行设计规范是不准确的。本文给出一种新的载荷谱编谱方法,
作为盐也米松口中的「兄弟」 ,中国与日本在工艺之道上曾经一脉相承,但如今,兄弟俩却散发出两种全然不同的气质。  中国,有数之不尽的收藏大家与文化商,在世界各大拍卖场所、艺廊锋芒毕露,但回到家中,他们中的绝大多数却都使用着廉价拙劣的碗筷酒器度过每一天。这样的日子,或许比不上日式普通家庭中的简便一餐,更别说情调。  日本人擅长小器,工艺亲民平和,它既流于口唇之间,也停在巴掌之上,无论文房墨宝还是桌间小
研究了五氟乙烷生产过程中催化剂三正丁胺的失活与再生行为,分别探讨了上、中、下 3 层失活催化剂的失活机理,针对失活机理不同的失活催化剂采用了不同的再生方法。结果表明: