基于GPU的单粒子三维重构并行优化研究

来源 :中国科学院计算技术研究所 | 被引量 : 0次 | 上传用户:chunzhu520
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
冷冻电镜已经发展为研究蛋白质结构最重要的手段之一,而从电镜图像进行单粒子三维重构是确定三维结构的主要方法。随着相关仪器设备和数据获取手段进步,产生的原始数据量也迅速增长,对数据处理能力提出了越来越高的要求。目前,为了获得一个高质量的三维重构结果,所需的计算量已经超过千万亿次浮点操作(PetaFlop)。   目前,构建千万亿次超级计算机系统的主流趋势是采用通用CPU和加速部件的异构处理器技术,如基于Cell Blade Engine(CBE)的千万亿次系统IBM Roadrunner。近年来,GPU的计算能力增长速度已经超过了摩尔定律,最新一代的GPU浮点峰值达到了1万亿次/秒(1TFlops),而且在单位价格和功耗的计算能力比CPU高出几乎一个数量级。到目前为止,已有大量来自众多领域的应用和数学库成功的在GPU上实现了加速。   本论文从分析应用特征出发,探讨适合GPU体系结构加速的负载特征,重点围绕冷冻电镜的单粒子三维重构算法,研究基于GPU加速部件的优化方法,论文的主要内容包括:   1.详细分析了单粒子三维重构算法的负载特征。对主要计算核心进行了深入的负载分析,重点关注其并行层次、算术密度、访存模式等关键特征。结果表明该算法在任务级、线程级和数据并行这几个不同层次上都有丰富的并行潜力,十分适合采用异构协处理器加速计算。提出了判断是否适合GPU计算的应用指标,包括:数据并行、计算密集、访存规则、CPU通信较少   2.考虑到GPU体系结构的特点,提出了一种面向GPU执行模型的优化框架。并在此基础上提出了针对GPU存储层次和执行模型的一系列优化方法,针对这些优化方向在存储管理、访存聚合、线程数据映射关系等多个环节做了大量的改进,对各种实现方案进行广泛的测试。   3.基于最流行的单粒子三维重构软件之一EMAN,在Nvidia CUDA环境下实现了并行化的单粒子三维重构程序EMAN-CUDA。在Nvidia G80体系结构上的实验表明EMAN-CUDA的核心代码相对于在AMD1.7GHZ Opteron CPU上获得10倍左右的加速比,实验还分析验证了论文提出的优化方法的有效性。
其他文献
基于Gibbs抽样的贝叶斯模型选择结合先验信息,可以得到良好的估计与预测效果,从而受到各领域研究的重视。本文通过分析Gibbs抽样和Metropolis—Hastings算法构造转移核的本质,探
随着互联网的飞速发展,数据呈爆发式增长,企业为了节约成本、提高资源利用率,纷纷在数据中心部署云计算平台。相比于传统的部署方式,云计算对计算、存储以及网络资源进行统一分配
众所周知,数据挖掘是一个从海量数据中发现并提取隐藏的、前所未知的、有价值的信息或知识,然后利用这些信息或知识做出重要的商业决策的过程。因此,分析数据库、数据集市和数据
学位
随着计算机技术的进步,近年来人机交互技术开始向着使得交互更加自然、高效的方向发展。最近几年出现的语音识别、手势识别等交互方式,让人们摆脱了传统交互设备的约束。空中手
食品安全事件的频繁出现,引发了消费者的恐慌,也影响了中国农产品的出口创汇,找到一种方法减少关系消费者切身利益的不安全食品事件发生,就成为了全社会关注的热点问题。国内外很
当今社会存在着各种不安全、不和谐的因素,严重威胁到国家、社会和人们的安全。视频监控是在现有条件下,对涉及公共安全相关领域的场所进行实时监控,有效预防、消除安全隐患的主
学位
网络融合和IP化是未来网络发展的必然趋势,终端融合是整个网络融合中重要的组成部分。在终端方面,融合体现为同一终端可以支持更多的业务功能。在当前的很多SIP/IMS终端上,除
当今社会乃信息社会。信息作为一种战略资源,其安全性关系到国家安全和民族利益。因此,如何保证信息的安全,已成为国内外学者的重要研究课题。密码学是保障信息安全的核心技
随着消费电子产品的普及、智能硬件的兴起,嵌入式设备的应用场景已经越来越广泛,对嵌入式设备的处理器要求也越来越高。专用指令集处理器(ASIP)凭借其可针对特定应用进行处理器
当前,软硬件系统的正确性验证问题已经成为工业界和学术界共同关注的一个大问题。模型检测作为一项对有限状态系统的性质进行自动验证的技术,是验证过程中主要采取的方法之一。