【摘 要】
:
[目的]为了加速海洋环流模式LICOM的积分计算,降低因分辨率的提升而带来的运行成本,本文设计并实现了基于CUDA C的GPU加速版本.[方法]本文基于目前最新的LICOM3版本,在分析LI
【机 构】
:
中国科学院计算机网络信息中心,北京 100190中国科学院大学,北京 100049;中国科学院大气物理研究所,北京 100029;中国科学院计算机网络信息中心,北京 100190;
论文部分内容阅读
[目的]为了加速海洋环流模式LICOM的积分计算,降低因分辨率的提升而带来的运行成本,本文设计并实现了基于CUDA C的GPU加速版本.[方法]本文基于目前最新的LICOM3版本,在分析LICOM海洋网格块的并行算法的基础上,结合使用CUDA线程并行计算海洋网格点,将LICOM主要计算程序移植到GPU平台上,并从数据传输和设备内存的使用两个方面进行优化.[结果]实验表明,GPU版本模拟结果的与原CPU版本基本一致.与使用相同数量的Intel Xeon E5-2680 V2 CPU相比,使用2至16块NVIDIA K20 GPU单个模式天加速了9.31到1.27倍.[局限]由于LICOM3计算的边界同步通信比较多,限制了程序的可扩展性,未来需要通过边界通信优化和算法优化来提高模式的可扩展性.[结论]本文对LICOM3程序进行了GPU版本的实现和优化,取得了一定的加速效果并保持较好的扩展性,为今后面向更大规模计算的海洋环流模式发展提供了经验和参考.
其他文献
[目的]对边缘智能技术进行系统而全面的介绍,为相关读者了解和关注边缘智能提供一定的参考,并启发更多的学者开展物联网时代边缘智能模型的研究.[方法]本文首先简要介绍了边
[目的]SDN交换机南向协议性能测试系统致力于通过构造测试场景,按照一定的流量策略探测被测交换机各项性能指标,评价其是否满足用户性能需求.[文献范围]本文重点调研了SDN交
[目的]通过对网络切片管理系统以及运营商行业实践的分析,为运营商5G独立组网(Standalone,SA)试商用阶段网络切片业务发展提供有效参考与样板.[文献范围]文章参考国际标准中
[目的]现有的云服务计算模型无法满足数据驱动型科研范式的发展.如何设计并实现符合数据密集型科学计算处理的架构是当前研究的一个热点方向.[文献范围]文章重点分析了数据驱
【目的】伴随5G和人工智能(Artificial Intelligence,AI)技术的飞速发展,各类型的应用不断涌现,不同应用对计算和网络都有着特定要求。为了给用户提供更好的体验,需要为不同应用提供满足需求的计算资源和确定性的网络资源,因此计算资源与网络资源的联合优化成为一个重要的研究领域。【文献范围】文章重点调研了计算资源与网络资源联合优化的解决方案,以及相关案例在现网中的应用等。【方法】本文
[目的]对3GPP中的5G网络音视频传输相关标准进行介绍,为相关运营商和服务提供商利用5G进行网络音视频传输提供参考.[方法]通过对3GPP标准进行研究,梳理介绍了基于5G系统的流
[目的]介绍了算力网络面向业务需求,在云、网、边之间按需分配和灵活调度计算资源的网络组织方式.该方式旨在实现更广泛的计算资源的统一调度和纳管.而在网络边缘侧,由于各种
[目的]针对材料科学工作者开展机器学习工作门槛较高这一现状,本文基于MatCloud研发一个用户友好、自动化的材料数据挖掘与机器学习模块Auto-Mat.[方法]本文对MatMiner和scik