两种Krylov子空间算法的并行性能改进研究

来源 :重庆邮电大学 | 被引量 : 0次 | 上传用户:foreststonezgdd
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
寻求大型稀疏线性方程组的高效并行解法是当前大规模科学计算中亟待解决的热点问题。Krylov子空间算法是求解大型稀疏线性方程组最流行和最有效的迭代方法之一,其并行计算主要考虑矩阵向量乘和内积计算。目前通过适当编码,矩阵向量乘在并行计算时不会造成严重性能降低的通信问题。但内积计算并非如此,由于内积计算需要全局通信,在分布式并行计算环境下其成为高效并行计算的瓶颈。   ORTHOMIN(m)算法和GCR(k)算法是两种Krylov子空间算法,为减少两算法内积计算引起的全局通信以提高并行性能,本文以油藏数值模拟问题为应用背景分别对两算法做了如下工作:   首先利用ORTHOMIN(m)算法的固有性质改变其计算次序,给出了该算法的改进形式,其次对算法进行了并行设计、理论分析,最后通过求解油藏数值模拟问题给出数值实验。同ORTHOMIN(m)算法相比,改进算法与ORTHOMIN(m)算法具有相同的收敛性,在分布式并行计算环境下进行并行计算时改进算法用连续内积计算代替了ORTHOMIN(m)算法分离的内积计算,消除了ORTHOMIN(m)算法两次内积计算的数据相关性,使同步开销次数减少为ORTHOMIN(m)算法的一半进而加大了计算时间相对通信时间的比重,提高了并行效率。理论分析表明当处理机台数较多时改进算法比ORTHOMIN(m)算法的并行计算时间要快,有更好的加速比及可扩展性。数值实验结果也表明改进算法的并行性能要优于ORTHOMIN(m)算法,更利于油藏数值模拟问题的并行求解。   对于GCR(k)算法,利用同样的方法给出了该算法的改进形式,并给出算法的并行设计、理论分析,且通过求解油藏数值模拟问题给出数值实验。与ORTHOMIN(m)算法类似,改进算法与GCR(k)算法具有相同的收敛性,在分布式并行计算环境下进行并行计算时改进算法使同步开销次数减少为GCR(k)算法的一半,提高了并行效率。理论分析同样表明当处理机台数较多时改进算法比GCR(k)算法的并行计算时间要快,有更好的加速比及可扩展性。数值实验结果也同样表明改进算法的并行性能要优于GCR(k)算法,更利于油藏数值模拟问题的并行求解。
其他文献
排序是信息检索的核心问题,因为一个搜索系统的好坏主要由它的排序结果的正确率来评价。信息检索中提出了许多排序模型。直到最近,被称为“排序学习”的机器学习技术被深入应用
随着Internet的飞速发展,Web的信息量越来越大,通用搜索引擎将面临信息采集、检索等方面更大的挑战。随着电子商务的蓬勃发展,网上商品的交易越来越频繁,更多的消费者通过搜索引
学位
短文本分类问题是短文本应用领域中亟待解决的问题,也是具有挑战性的关键问题之一,具有重要的应用前景。由于短文本自身长度较短的特点,其描述概念能力弱,缺乏一定的语义关系
学位
VoWLAN(Voice over WLAN)是当前VoIP(Voice over IP)和无线局域网研究中的一个热点,它结合多媒体通信、计算机网络、无线传输、嵌入式系统开发等研究领域,主要研究基于无线局域
学位
随着计算机和网络技术的快速发展,远程会议、视频点播和网络教育等实时多媒体应用日益广泛。这些实时多媒体应用要求将同样的数据从一个源点同时传输给大量的目的节点,促使了多
学位
网络的广泛运用推动了分布式计算的快速发展。网格作为分布式计算的重要支撑技术受到广泛的关注,它不仅突破了单个计算机计算能力的限制,而且将分布的资源组织起来,协同地解决大
学位
随着互联网的迅速发展和普及,网络已成为人们生活中不可缺少的一部分。网络中存在着各式各样的信息,这些信息以网页为载体,呈现在用户面前。网页中蕴含的丰富信息为企业竞争
彩铃业务是移动运营商的一项重要增值业务。当前由于彩铃用户普及率趋向饱和,用户活跃性降低,运营商为吸引用户使用和更新彩铃,经常开展各项彩铃营销活动向用户推荐铃音,但由
基于内容的图像检索技术(Content-based Image Retrieval,CBIR)是从20世纪90年代开始兴起的一种新的检索技术,它自动提取图像的颜色、纹理和形状等视觉特征作为索引来进行检
学位
视觉目标跟踪是计算机视觉领域的重要课题。面对跟踪过程中来自自然场景多种复杂变化的干扰,当前视觉跟踪算法由于其普遍采用的模型驱动模式的固有缺陷,算法的准确性和鲁棒性