多GPU环境下三点相关函数算法研究

来源 :天津大学 | 被引量 : 0次 | 上传用户:Purview
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
N点相关函数在星系分布的研究上有重要的意义,是宇宙学模拟中的基本问题。但是朴素解法的计算复杂度却随着点集的扩大而呈点相关数的次方增长,虽然有基于KDTree等的相关优化算法,但是其复杂度也与点集中的点数相关,处理大规模点集时性能也难以满足要求。一种基于递归卷积的优化算法,可以求得近似解,而为了取得较高的计算精度,则要扩大计算矩阵的规模,这同样需要解决相应的性能问题。本文对解决递归卷积算法在解三点相关函数所存在的性能问题、计算精度问题、以及二者之间的折衷问题进行研究和分析。本文首先使用宇宙学模拟中的真实数据分析原始算法在不同的矩阵规模下的计算性能问题和计算精度问题。以此入手,提出相应的解决方案,即通过扩大矩阵规模提升相应的计算精度,而另一方面利用多GPU解决随之带来的性能问题。对于算法并行优化,首先将算法简单迁移到单颗GPU上运行,分析对比不同参数下的性能变化。其次,分析改进后的GPU算法的程序结构,对GPU下的快速傅立叶变换的特性进行分析,调整快速傅立叶的变换维度和变换尺寸,以此获得进一步性能优化。最后分析多GPU程序运行特点,将优化过的单GPU算法进行调整,设计并实现出多GPU环境下的算法,使算法在多GPU环境下相对单GPU的加速比能够接近GPU数,以充分发挥各个GPU的计算效率。本文使用Tesla C2050GPU相关环境进行相关实验,实验结果显示多GPU环境下的递归卷积算法较原始算法在较高计算精度下,性能提升近七百倍。
其他文献
教育并不局限于学校教育,更重要的是儿童成长发育过程中身心健康成长的教育。通过大量相关文献的阅读和研究发现,儿童敏感期研究领域中存在着大量潜在的知识数据,有很高的研
等几何分析是一种基于CAD模型的几何的精确表示来进行模拟分析的新型技术,它的提出为实现CAD/CAE的无缝融合提供了新思路首先,本文对等几何分析的产生背景特点研究现状和热点问
无线Mesh网络(Wireless Mesh Network,WMN)是一种宽带无线网络结构,也可以看成是MANET和WLAN的结合体。在WMN中,随着网络拓扑逐渐复杂、节点数目逐渐增多,其网络性能可能会随之下降
随着高清摄像技术以及图像处理技术的快速发展,视线追踪系统的相关研究在最近几年取得了长足的进步。参考点光源等辅助手段的引入,有效提高了系统的精确度以及对使用者头部移动
随着社会经济的发展,水泥在世界范围内被广泛应用,已经成为基础建设中必不可少的建筑材料,并且需求量越来越大,同时水泥的高质量和高性能也越来越受关注。从微观上来看,水泥
曲面网格参数化与四面体网格参数化是处理三维体网格的一个关键问题。曲面三角网格参数化是实现纹理贴图的基础;体网格的参数化是信息重用、形状匹配与分析、网格的重构以及
流程工业在生产的过程中会积累大量的检测数据,对这些数据进行知识发现将对工业生产和控制过程产生有意义的指导。在分析了流程工业生产过程的几大特点之后,课题组提出了流程
随着科学技术的发展和社会的不断进步,人类社会已经慢慢呈现出高度信息化结构。由于信息的多样性以及海量的信息数据,人类自身处理信息的能力十分有限,所以信息化时代已经正
近年来,随着我国石油天然气管道运输事业的快速发展,而管道施工的工程量大,焊口多,易发生质量问题,每处问题都可能导致严重的后果。这就对焊接自动化过程的质量控制提出了很高的要
蛋白质翻译后修饰在细胞生命过程中起到至关重要的作用,多种蛋白质翻译后修饰相互影响、相互协调,共同维持、促进各种细胞活动的正常进行。然而,翻译后修饰的鉴定在生物学上