面向超级计算机的I/O实时监控与自适应优化技术研究

来源 :山东大学 | 被引量 : 0次 | 上传用户:tauliwn
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
超级计算机自诞生起就一直活跃于地球模拟、生命科学以及先进制造等科学与工程领域,可以说它代表了一个国家在信息处理领域的综合实力。随着各国在超算上倾注了大量的人力物力,高端计算芯片和大规模集群技术的研究得以快速发展,超级计算机的计算能力也得到了指数级发展。算力的急剧提高对人工智能、脑模拟等新兴应用也起到了巨大的推动作用。但是与快速发展的计算能力相对的是,存储能力的发展仍然相对缓慢,存储系统与计算系统之间的性能鸿沟正变得越来越大。有诸多的研究表明,存储系统已经成为了制约应用扩展到更大规模的关键因素。为了满足各类高性能计算应用日益增长的输入输出(Input/Output,I/O)性能需求,超级计算机引入了许多新的存储技术以及新的存储介质,其架构也逐渐向多介质多层级的复杂架构演进。一方面,这种多层级的复杂架构提高了存储系统的服务能力上限,使其能够支撑种类繁多的高性能科学计算应用。另一方面,多层级的存储架构也带来了冗长的I/O路径,使得存储系统的有效利用更具挑战。更糟糕的是,应用间的冲突干扰、部分组件的性能异常等影响用户应用性能的问题在拥有复杂架构和深共享特点的超算存储系统中会更加的突出。与此同时,在多用户使用的动态运行环境下,问题现场难以复现,从而对用户定位性能问题带来了极大的困难,导致了用户无法对遇到的问题做出针对性的调整。因此,对用户来说,如何在多层级的架构下有效优化应用I/O性能已然成为了一个巨大的挑战;对于管理员来说,如何管理好多层级的存储资源也成为了一个严峻的挑战。为了解决以上挑战,帮助用户提升应用性能,帮助管理员优化资源配置,提高系统利用率,本文面向拥有多层级存储架构的超级计算机开展了端到端I/O性能实时监控及自适应I/O优化技术的研究,主要的研究成果如下所述:1.针对大规模计算集群由于架构复杂,负载不断变化导致问题热点难以定位或重现的问题,本文研究了面向大规模计算集群的I/O实时性能监控和分析的技术,提出了轻量级的端到端的透明采集,海量数据的存储与快速预处理以及多层级数据分析和异常自动检测等关键方法和技术,并设计实现了一个面向大规模计算系统的端到端的轻量级I/O性能监测与分析诊断系统Beacon+。Beacon+通过轻量级的后台采集程序对应用的I/O请求经过的I/O全路径进行了采集,同时可以以极低的开销进行大规模的扩展。此外,Beacon+已经实际部署到了多层级架构的尖端超级计算机神威太湖之光、神威下一代超级计算机以及传统两层架构的曙光“派”超级计算机上,充分验证了 Beacon+的可用性和通用性。2.本文对Beacon+收集的海量数据进行了深入的分析,揭露了许多超级计算机上的性能问题,为应用开发者优化应用性能,系统管理员提高系统利用率,系统设计人员设计更好的系统提供了借鉴。本文发现的问题主要包括:应用自身低效的I/O行为导致应用性能低下,应用间的冲突干扰导致应用性能频繁抖动,系统节点的性能降级导致应用整体性能受限,负载不均导致系统利用率低、应用性能不佳,系统参数的错误配置导致应用性能达不到预期等。3.针对应用自身I/O行为低下、扩展性不足,且现有中间件无法有效利用多层级存储系统等问题,本文研究了应用层的I/O自适应优化技术,提出了一种面向多层级存储架构的I/O请求调度方法,该方法引入了实时监控系统(例如:Beacon+),可以获取实时的全局视图来进行动态的I/O请求调度,例如:空闲时快速输出,繁忙时通过内存缓存等。进一步,本文设计实现了一个基于实时监控系统的面向多维网格数据的高性能并行I/O中间件HPPIO。HPPIO不仅可以从源头帮助应用自适应的优化其I/O性能并充分利用多层级的存储系统,也解决了许多传统中间件在当前复杂存储系统下面临的问题,例如:无法有效利用多层级存储系统,缺少全局视图导致优化效果受环境影响往往大打折扣等。此外,HPPIO的部分设计已经在中国气象局的业务系统中正式得到了应用,这也验证了 HPPIO的有效性。4.针对应用间冲突干扰、系统节点异常、系统负载不均以及参数配置错误等问题,本文研究了系统层的自适应优化技术,提出了一个基于历史数据的作业I/O行为预测模型以及一个端到端的I/O自适应优化模型,并设计实现了一个基于实时监控系统的端到端的I/O自适应优化工具AIOT。它无需修改应用代码,可以通过系统级的优化策略来帮助提高应用的性能,极大的免去了用户使用的学习成本。AIOT既可以为作业选择最优的I/O路径来避免资源竞争冲突、合理地调度存储资源,也可以在存储系统的多个层级上为作业进行配置参数的调整来提高其性能。通过在神威太湖之光的部署测试,验证了 AIOT不仅可以提高应用的I/O性能也可以提高存储系统的资源利用率。
其他文献
目的:气虚型肝癌(Qi-deficiency liver cancer,QDLC)是一种常见的恶性肿瘤,也是传统医学在肝癌研究中的一个重要部分。人参是中医临床治疗“气虚”重症不可缺少的中药之一,其独有的功能在气虚体质的肿瘤治疗中具有特殊的意义。目前,现代医学对人参治疗肿瘤的研究较多,但对气虚型肝癌的相关研究较少,其中的作用机制也并不明确。因此,本研究主要通过人参不同有效部位治疗气虚型肝癌的药效学评
学位
背景:宫颈癌是女性第四大常见恶性肿瘤,已经成为全球中年妇女生命健康的重大威胁。我国宫颈癌的防治形势更加严峻,其发病率逐年上升且年轻化趋势明显。化疗是宫颈癌的主要治疗手段之一。广谱抗癌药紫杉醇是晚期宫颈癌化疗的一线用药,但其在水中的溶解度极低。为了解决这一难题,Taxol?选择使用助溶剂Cremophor EL和无水乙醇来溶解紫杉醇,成为第一个获批用于临床的紫杉醇剂型。但遗憾的是,助溶剂相关毒副作用
学位
随着电子器件不断朝着高功率密度方向发展,高效的热量传输和转化技术是适应电子器件不断往小型化和集成化发展的重要技术支撑。近年来,石墨烯这一二维纳米材料因具有优异的电学和热学性能、稳定的化学性质、丰富的原材料来源等优势受到研究人员和产业界的广泛关注。并且,石墨烯材料在纳米尺度的热质传递机制对其在实际应用中所展示出的宏观性能具有关键作用,但目前对其热质传递机理和精准调控的研究有待进一步深入。本论文通过多
学位
乳化沥青冷再生技术因具有常温下施工、沥青混合料回收料(RAP料)利用率高等优点,受到了越来越多学者关注。然而,目前绝大多数研究集中于乳化沥青冷再生混合料的早期和终期性能,而对其服役多年后的性能变化知之甚少。长期服役过程中由于环境因素和行车荷载的作用,原材料特性将发生改变,如RAP料表面新旧沥青缓慢相融、新沥青发生老化等,这都将显著影响冷再生混合料的长期性能。此外,虽已有研究表明工业固废(如粉煤灰)
学位
罗非鱼是我国淡水养殖行业最重要的养殖品种之一,产量较高。罗非鱼因肌间刺较少和营养丰富而广受消费者的青睐。鱼类死后由于外源微生物及内源酶的联合作用极易发生腐败变质,冻藏因能最大限度保全水产品品质、延长货架期,罗非鱼目前主要以冷冻罗非鱼片的形式进行流通。但是冷冻品在冻藏过程中仍然会发生色泽、质构、组织形态等品质劣变,品质劣变程度主要与原料新鲜度、冻结速率、冻藏温度和时间、解冻方式和冰晶生长、蛋白变性等
学位
山药(Dioscoreae Rhizoma)为薯蓣科(Dioscoreaeceae)薯蓣属(Dioscorea L.)缠绕草质藤本植物薯蓣(Dioscorea opposita Thunb.)的干燥根茎,具有补脾养胃、生津益肺、补肾涩精之功。其使用历史悠久,既是临床常用中药之一也是日常生活中常用保健食材。在我国有悠久的栽培历史,分布广泛,各地区形成具有各自特色的地方品种,受多种因素影响,栽培种质形
学位
目前,中国适业人口约为9.3亿,就业人数为7.7亿,但工伤保险覆盖人数只有2.6亿。由此推算,中国至少有超过5亿的劳动者游离在工伤保险制度之外,尤其是3亿农民工群体,从事的工作工伤风险偏高,享受的工伤保障较低,这种现状与共同富裕的要求严重不相符。本文研究农民工工伤保险制度,通过聚焦工伤保险制度中政府、企业、农民工三方的责任分担机制,试图建立起符合中国特色的工伤保险机制。本文首先对中西方相关文献进行
学位
含马兜铃酸中药的安全性是社会广泛关注的热点问题,虽然一些含AA-I含量高的品种如关木通、广防己、青木香等已经禁止使用,但仍有些马兜铃科中药如细辛还在临床使用。社会上一直有将所有马兜铃科中药禁用的呼声,但由于目前缺乏深入、系统和全面的研究,相关品种禁用与否缺乏充分的科学依据,这使得相关品种的临床使用和药品监管面临极大的挑战。迄今,已发现的AAs有约170种,不同马兜铃科中药所含的AAs种类和含量各异
学位
《木结构设计标准》(GB50005-2017)的制定为我国木结构建筑的推广应用和发展创造了必要条件,但其内容主要来自北美研究成果,这些内容并不完全适用于工程上应用较多国产材料的木结构墙体。为了降低侧向荷载对木结构建筑造成的损坏,木结构墙体增强设计研究成为亟待开展的课题。为了探索提高木结构墙体抗侧性能的新途径,本研究就斜撑增强木结构墙体抗侧性能及其机理进行了系统研究。采用拟静力加载试验法,重点研究了
学位
背景结直肠癌已成为全球第三大致死性癌症,每年致死病例约占所有癌症死亡人数的十分之一,且发病率及死亡率逐年上升,肿瘤耐药性和异质性仍然是结直肠癌治疗面临的主要挑战。NOXA是一种BH3-only促凋亡蛋白,通过线粒体凋亡途径参与细胞死亡决策,在结直肠癌中高表达,但蛋白半衰期较短。泛素-E3酶CRL5(Cullin5-RING Ligase)介导的NOXA多聚泛素化及泛素化修饰依赖性蛋白酶体降解是防止
学位