论文部分内容阅读
针对分布式文件系统HDFS以流式的方式访问大文件时效率很高,但是为解决海量小文件的操作特别是频繁访问重复的小文件时效率比较低的问题,提出了一种基于集中式管理的缓存优化方案。该方案通过对缓存的小文件进行集中式管理,采用一种新的数据一致性管理机制,提高海量小文件的读取性能。实验结果表明,该方案有效地提高了小文件的读取效率,减少了小文件的访问时延。