搜索筛选:
搜索耗时0.0914秒,为你在为你在102,285,761篇论文里面共找到 5 篇相符的论文内容
类      型:
[会议论文] 作者:Xiao Xuan-ji,Yuan Liang,肖玄基,袁良,Zhang Yun-quan,Li Yu-cheng,张云泉,李玉成, 来源:2012全国高性能计算学术年会 年份:2012
  MAGMA是第一个面向下一代体系架构(多核CPU和GPU)开源的线性代数软件包,它采用了诸多针对异构平台的优化方法,包括了混合同步,通信避免和动态任务调度系统.它在功能,数据存储......
[会议论文] 作者:Xiao Xuan-ji,肖玄基,Zhang Yun-quan,张云泉,Li Yu-cheng,李玉成,Yuan Liang,袁良, 来源:2012全国高性能计算学术年会 年份:2012
MAGMA是第一个面向下一代体系架构(多核CPU和GPU)开源的线性代数软件包,它采用了诸多针对异构平台的优化方法,包括了混合同步,通信避免和动态任务调度系统.它在功能,数据存储,接口上与LAPACK相似,可以发挥GPU的巨大计算能力进行数值计算.本文首先对MAGMA中的矩阵分解......
[会议论文] 作者:JIANG Li-yuan,蒋丽媛,ZHANG Yun-quan,张云泉,LONG Guo-ping,龙国平,JIA Hai-peng,贾海鹏, 来源:2012全国高性能计算学术年会 年份:2012
连续的数据无关是指计算目标矩阵连续的元素时使用的源矩阵元素之间没有关系且也为连续的,访存密集型是指函数的计算量较小,但是有大量的数据传输操作.本文在OpenCL框架下,以bitwise函数为例,研究和实现了连续数据无关访存密集型函数在GPU平台上的并行与优化.在考察......
[会议论文] 作者:Zhang Long,张龙,Zhang Yun-quan,张云泉,Long Guo-ping,龙国平,Jia Hai-peng,贾海鹏,Yan Shen-gen,颜深根, 来源:2012全国高性能计算学术年会 年份:2012
  目前GPU已经成为提高算法性能的一个重要途径,OpenCL 是一个为异构平台编写程序的框架,此异构平台可由CPU、GPU 或其他类型的多核/众核处理器组成.本文主要介绍基于OpenC...
[会议论文] 作者:Pang Xu,庞旭,Zhang Yun-quan,张云泉,Long Guo-ping,龙国平,Jia Hai-peng,贾海鹏,Yan Shen-gen,颜深根, 来源:2012全国高性能计算学术年会 年份:2012
OpenCL作为一种面向多种平台、通用目的的编程标准,已经对许多应用程序进行了加速.由于平台硬件和软件环境的差异,通用的优化方法不一定在所有平台都有很好的加速.本文通过对均值平移算法在GPU和APU平台的优化,探讨了不同平台各种优化方法的贡献力,一方面研究各个平......
相关搜索: