基于并行文件系统的客户端缓存优化系统机制研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:diod
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在大数据的时代背景下,数据密集型计算面临着新的机遇与挑战。传统的单机文件系统在大数据的需求面前显得力不从心,被广泛应用的并行文件系统在高并发的数据请求下,其缓存性能也难以满足数据密集型应用的需求。因此,提高并行文件系统缓存性能已经成为了一个重要的研究课题。  基于并行文件系统的客户端缓存优化系统(CCFC),利用开销预测模型有选择的缓存开销较大的写请求,能够最大化并行文件系统客户端缓存的性能。当应用程序向并行文件系统写文件时,并行文件系统首先分析写请求访问的文件域,同时向相关数据节点发送子请求。只有当所有数据节点完成它们所负责的子请求后,并行文件系统才会返回请求完成信号。CCFC系统通过修改PVFS2的客户端模块和服务模块,对文件写请求进行分析,利用提出的开销预测模型预估出 PVFS2完成这些文件写请求所产生的开销。基于开销预测模型,CCFC系统有选择地缓存那些带来较大开销的写请求。当程序从数据读写阶段进入到计算阶段时,缓存中的数据以后台读写的方式发送到数据节点。CCFC系统通过开销预测模型对文件写请求开销进行排序,只缓存部分写请求,避免大量缓存资源的占用。基于开销预测模型,CCFC系统能够有效地降低高开销文件写请求的完成时间,显著的提升并行文件系统的吞吐率。  测试结果表明,在服务数据密集型的测试集时,CCFC缓存系统相比传统的写通过缓存和写回法缓存,可以带来最大显著的吞吐率提升。实验表明,CCFC系统能够最大化客户端缓存的利用率,有效地提升并行文件系统的性能。
其他文献
在存储系统中,CPU的处理速度远大于磁盘等I/O设备的读写速度,两者间的速度不匹配严重影响了系统整体性能。预取技术能够有效地弥补I/O设备与CPU之间的速度差异,因此被广泛应用。
网格技术将所有可用于共享的资源(例如,计算机、高性能设备、昂贵仪器、存储设备、科学数据、软件、数据库等)通过网络连接起来,并将它们转化成一种随处可得的、可靠的、标准
相对于传统的磁质机械硬盘,基于闪存的固态硬盘具有更高的读写速度、更低的能耗、更好的抗震性和更低的噪音。因此,固态硬盘正越来越多地被运用在计算机系统中。但是,因为固态硬
语音识别(speech recognition)是机器通过识别和理解过程把人类的语音信号转变为相应的文本或命令的技术。其根本目的是研究出一种具有听觉功能的机器,这种机器能直接接受人的
应用系统对海量存储技术的要求越来越高,经典的基于块访问接口的SAN和基于文件访问接口的NAS系统已力不从心,而新出现的基于对象接口的网络存储技术以高性能、高可扩展性、易管
嵌入式设备能与用户亲密接触,最重要的因素就是它必须能提供非常友好的用户界面、图像界面和灵活的控制方式。这方面的要求使得嵌入式软件设计者要在图形界面的设计上多下功
随着数字化技术的飞速发展,数字视频信号的传输技术更是受到人们的关注。相比较其它类型的信息传输如文本和数据,视频通信需要占用更多的带宽资源,因此为了实现在带宽受限的条件
随着多核体系结构的崛起,多线程编程目前已经广泛使用到多个领域,如科学计算、桌面应用程序、网络服务器和移动设备。然而,多线程程序设计也给编程人员带来新的挑战和问题。数据
随着人类基因组计划的进展,对于基因的功能和基因组内各基因的研究逐步深入。研究基因在不同时间和条件下的表达情况,是认识基因功能的一个主要途径。cDNA微阵列技术可以同时
随着软件工程及相关理论的发展,OMG组织提出了基于模型驱动(MD)思想的新方法学——模型驱动架构(MDA),该方法在实际运用中得到了发展。但是,当前企业在采用MDA技术进行软件开发