基于GPU平台的KLU并行算法的研究:对角线块的LU分解

来源 :内蒙古大学 | 被引量 : 1次 | 上传用户:JAVA01
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着电子科学技术的发展,为设计高质量的电路,电路模拟必不可少。在电路模拟的过程中要涉及到稀疏线性方程组的求解。而随着电路矩阵规模的不断增大,对电路矩阵的求解已经成为电路模拟过程的一个瓶颈。针对电路模拟过程中产生的电路矩阵的特点,通常均采用直接法来进行此类线性方程组的求解。目前常用的求解器有sparse 1.3、superLU、KLU,其中以Timothy Davis教授开发的KLU最为有效率。KLU主要由预处理,首次LU分解,再分解和回代求解这几个部分组成。再分解部分是算法的重要组成部分。在一次电路模拟过程中,就是通过多次调用该部分来完成对稀疏矩阵的数值LU分解。因此,本文主要对这部分的算法进行了并行研究和探索,并提出了基于GPU平台的可行的并行算法。KLU算法在LU分解过程中,采用的算法是基于高斯消去法的Gilbert-Peierls算法。我们通过研究串行算法和程序提出了两种不同的并行设想,并在GPU平台上设计和实现了四种不同的并行算法P_Llen算法、P_Ulen算法、P nk算法和P_stream算法。我们在实验平台Ⅰ上对这四种并行算法进行了性能测试和分析,通过分析我们发现P_stream算法较前三种并行算法在性能上有较大的优势,但由于该并行算法受限于实验平台Ⅰ中GPU显存的限制,导致并行度较低,性能较串行算法有所下降。为提高P_stream算法的并行度,我们在GPU显存容量更大的实验平台Ⅱ上对其进行了性能的测试和分析。通过分析,我们发现随着并行度的提高,P_stream并行算法性能也随之得到提升,但还是受限于显存容量的限制,导致性能较串行算法并没得到提升。由于我们是首次尝试对KLU算法在GPU平台上进行并行算法的实现,加之稀疏矩阵数据的稀疏性、LU分解数据的前后依赖性、硬件限制以及自身编程经验的不足,导致并行算法性能较原有串行算法略有下降,但在本文中我们提出的一些并行设想以及尝试也能为同方向的研究者提供很好的借鉴。
其他文献
私人军事公司(Private Military Company/Contractor,简称PMC)是一种兴起于20世纪90年代的新兴事物。PMC的本质是追求利润的最大化,这本无可厚非,但其特殊的业务模式已经超出
创新理论由美籍奥地利经济学家熊彼特在其1912年所著的《经济发展理论》中首度被提出,在之后相继出版的《经济周期》和《资本主义、社会主义和民主》两本书中开始形成了完善
虚拟物流是军地物流一体化、后勤保障社会化的一种组织模式,其关键点在于实现军地物流资源的全面共享和任务协同运作。而网格技术的核心则是资源共享和虚拟组织中的协同问题
企业投资是实现经济增长和人们生活质量提高的本源,同时也为股东创造了价值,但是在现实生活中,却存在大量无效率投资行为,形成了对社会资源的浪费。基于“经济人”和“理性人
本文通过选用三种商业颗粒活性炭为吸附剂,以甲苯、丙酮、甲苯、甲醇和1,2-二氯乙烷五种有机气体为吸附质,进行单组份固定床恒温吸附实验,关联分析活性炭物性和吸附质物性对
本文以提高钻探用聚晶金刚石复合体(PDC)的性能为目的,从PDC合成块尺寸的计算、合成块组装方式的改进出发,采用SEM、EDX、XRD、Raman光谱、DTA-TG和有限元分析等研究方法,对P
资本是公司赖以生存的基础,其不仅是公司运作的物质条件,也是公司承担债务的基本保障,而股东的出资是公司资本形成的起点,是构成公司法人财产的基石,同时也是公司人格得以完
目的探讨影响吸烟的危险因素、保护因素,以及吸烟者戒烟意愿的影响因素,从而为发展戒烟的策略和方法提供理论依据。方法采用整群分层抽样方法,从长沙县、浏阳市和长沙市各选
岩溶地区复杂的水文地质条件及较低的勘查程度,使得勘察所获得的资料与隧道开挖后实际揭露出来的围岩特征有较大出入,造成隧道施工中经常出现预料不到的不良地质体,如松散堆
随着新课改的推行,学生的科学素养得到了进一步的重视,一门以全面提高学生的科学素养为总目标的课程------初中科学课,在时代的呼唤下来到了初中学生的身边。初中科学综合课