【摘 要】
:
在高性能计算领域中,现代科学计算应用中经常使用大规模矩阵分解进行线性系统的求解。Cholesky分解算法是其中一种最常见的矩阵分解算法,它主要用于地质领域、气候领域和电磁学领域的科学计算应用。近年来,多核共享内存系统中基于任务模型的tiled Cholesky分解算法已成为热门技术。它能够在较小的矩阵块上进行细粒度计算,并通过Open MP提供灵活的执行顺序,因此适合在多核共享内存系统中进行小规模
论文部分内容阅读
在高性能计算领域中,现代科学计算应用中经常使用大规模矩阵分解进行线性系统的求解。Cholesky分解算法是其中一种最常见的矩阵分解算法,它主要用于地质领域、气候领域和电磁学领域的科学计算应用。近年来,多核共享内存系统中基于任务模型的tiled Cholesky分解算法已成为热门技术。它能够在较小的矩阵块上进行细粒度计算,并通过Open MP提供灵活的执行顺序,因此适合在多核共享内存系统中进行小规模分解计算。然而在分布式内存系统中,Open MP任务模型无法和基于MPI的传统进程模型共同工作,而基于传统进程模型的分布式分解算法效率较低,且内存占用较大。这使得国际标准算法库Sca LAPACK很难满足当今大规模矩阵分解的高性能要求。本文尝试从多个角度解决上述问题,设计更加高效的分布式Cholesky分解算法。首先本文针对传统分布式程序无法引入任务模型、分解效率低以及内存开销大等问题,使用最新Open MP标准和Open MP任务模型重新设计算法,并考虑使用线程代替进程以减少内存消耗。其次本文针对科学计算应用中出现的低秩输入矩阵,设计了对应的低秩计算核心。该类核心以分解准确度为代价,从矩阵低秩特性中获得性能收益。本文主要研究内容概括如下:(1)针对基于传统进程模型分布式Cholesky分解算法存在的分解效率问题,提出了基于“MPI+Open MP任务模型”编程模型的分布式Cholesky分解算法。该算法可以对满秩或者低秩输入矩阵进行分解,并引入最新Open MP原语实现了两种MPI和Open MP任务模型的互操作性解决方案。该算法主体使用Open MP进行任务构造和调度,可以改善分布式Cholesky分解算法的负载平衡并提升性能。同时在程序中使用线程代替进程进行计算,可以减少内存消耗。该算法还对传统分布式数据布局进行了改进,以减少任务调度的负担并改善性能。(2)针对目前高性能计算应用中常见的低秩输入矩阵,提出了多种分布式低秩Cholesky分解算法。该类算法针对分布式环境进行了优化和改进,并使用上述编程模型。其中,FSCU-BC算法在基准算法基础上切换了压缩顺序和通信顺序,实现了通信后的本地压缩并改善了分解效率;改进FCSU算法将压缩步骤提前至三角求解步骤之前,并将低秩计算核心应用至三角求解和更新步骤以获得更多收益;改进CFSU算法使用一种新的低秩计算内核。该内核使用了一种基于自适应交叉逼近算法的再压缩步骤来减少计算复杂度,同时避免了秩堆积的风险。(3)本文基于MPI和Open MP任务模型实现了基于上述满秩和低秩分解算法的分布式求解器。该求解器可用于大规模对称正定系统系数矩阵的分解以及求解过程,并提供满秩输入和低秩输入两种模式。在输入系数矩阵为低秩矩阵时,可以使用低秩分解算法进行求解过程加速。本文采用了低秩Laplacian矩阵,对该求解器的分解效率、分解准确度以及内存消耗情况进行了实验分析,并详细分析了程序的优缺点。实验结果表明该求解器在性能和内存消耗方面,较基于进程模型的传统分布式求解器具有一定优势。其运行效率的提升约为30%到50%,内存占用率的减少为40%。同时在低秩输入模式下,低秩分解运行时间为满秩分解的三分之一到四分之一,分解准确度也在合理范围。
其他文献
近年来,随着经济社会的高速发展,人类对自然界的破坏加剧,各类细菌病毒滋生蔓延,社会公共安全事件频发。2019年末,新型冠状病毒(COVID-19)疫情突然爆发,尽管各国积极启动了精准防御措施,但疫情仍呈蔓延之势。医用一次性防护服因其高效阻隔作用,可有效防止血液、飞沫、体液等生物污染源的侵害,成为疫情防控期间最重要的防护装备之一。然而,随着使用量和需求量的增加,医用一次性防护服暴露了严重的舒适性差及
背景及目的:子宫内膜癌是发生于女性生殖系统中的上皮性恶性肿瘤,全球每年有接近20万的新发病例,已经成为仅次于卵巢癌和宫颈癌的第三大常见妇科恶性肿瘤。目前子宫内膜癌的病因尚不清楚,缺乏有效治疗手段。中药具有广谱抗癌性、副作用小、降低复发等优势,寻找有效的天然药物为子宫内膜癌的治疗提供了新的研究方向。淫羊藿素有广泛的药理学活性,尤其具有显著的抗肿瘤活性。FOX蛋白是高度保守的转录因子超家族,在上皮细胞
齿轮箱作为跨座式单轨列车的动力部件,其运行是否稳定可靠则直接关乎列车运行的安全。随着跨座式单轨列车应用范围的增大,列车的运行速度也随之提升,使得对列车组的轻量化以及稳定性的要求变得更加严苛,要求在齿轮箱降低其重量的同时也必须具备足够的强度来满足列车安全运行的要求。在列车运行过程中,齿轮箱不仅承受着来自电机的激励载荷,还会受到轮轨的冲击载荷,为了在设计的初始阶段确保齿轮箱能够安全可靠地运行,常常需要
随着云计算技术的进步,多种多样的云服务已应用到人类生产、生活的各个领域。随着政府、企业、社会和个人对于云计算服务的依赖程度加大,作为云计算服务基础设施的互联网数据中心面临着前所未有的负载压力。根据负载的应用场景可以将数据中心内的负载分为在线服务和离线作业,在线服务具有较高的实时性要求,离线作业则可以容忍一定的执行延迟和任务失败。由于在线服务对于请求处理的实时性要求较高,会按照峰值请求量时的资源需求
10kV配电网带电作业是当下优质供电服务得以实现的重要方法,对我国现代化电网运行维护技术的发展是至关重要的。但是配电带电作业具有一定的危险性,劳动强度高,对作业人员需要专业的技能要求高,针对目前带电作业主要仍是人工操作的实际情况,通过仿真计算一定长度空载容性电缆时可能产生的电容电流和分闸过电压,明确绝缘操作工具的防护性能,研制安全可靠的作业工具,这可保障作业人员的安全。本人参与的实际工作与研究的重
随着我国体育市场的不断发展以及我国企业并购重组的推进,目前我国的一些体育公司开展了行业内的并购行为。但部分体育公司在并购过程中缺乏有效的并购财务风险防控机制措施,同时学术界对体育企业之间的并购也缺乏一些并购财务风险评价标准体系,导致整个并购过程中的财务风险较高,进而影响了企业并购结果及并购后的经营绩效。因此,本文以成都体投并购莱茵体育为具体的研究案例对象开展评价分析,发现问题并给出相应的并购财务风
经过十几年的发展,钙钛矿太阳能电池的光电转换效率(Photoelectric Conversion Efficiency,PCE)已经达到了25.7%。钙钛矿太阳能电池具有带隙宽度值可调、载流子扩散长度长、制备工艺简单、制备成本低等优点,学界普遍认为有望取代商用硅太阳能电池。现阶段钙钛矿太阳能电池结构中的电子传输层以二氧化钛(Titanium Dioxide,TiO2),二氧化锡(Tin Diox
红牛产业是平凉市的传统优势产业,也是平凉市经济发展的支柱产业。本文基于平凉红牛产业发展现状,提出了促进平凉红牛产业可持续发展的对策,包括完善肉牛繁育体系、建立完善的饲料保障制度、加强疫病防控及安全卫生保障体系建设、以供应链顺畅助推全产业链高质量发展。
小学综合实践活动课程是义务教育阶段基础教育课程体系中重要的组成部分。利用本土文化资源开展小学综合实践活动课,是近年来课程改革背景下对小学综合实践活动课程提出的新要求。本文从利用当地名人资源、自然资源、美食资源几个方面,阐述了开展小学综合实践活动的策略。
国民经济的快速发展导致燃料需求量的增加,在我国燃料比例中,煤仍然占有主导地位,促进了国民经济的不断发展。近几十年来,浅埋煤炭资源的枯竭使煤炭开采深度面向更深的地下,因此井筒所面临的外界环境越来越恶劣,破损井筒数量逐渐增多。某矿2009年发生突水溃砂淹井事故,后经专家组讨论,确定使用内套式钢板混凝土新井壁对原破损井壁加以修复,新沉降井壁将与原有井壁组成复合井壁共同受力。复合井壁投入生产后,所面临的外