CPU+GPU异构并行的矩阵转置算法研究

来源 :东北师大学报:自然科学版 | 被引量 : 0次 | 上传用户:zimuogu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对当前算法优化研究一般局限于单一硬件平台、很难实现在不同平台上高效运行的问题,利用图形处理器(GPU)提出了基于开放式计算语言(OpenCL)的矩阵转置并行算法.通过矩阵子块粗粒度并行、矩阵元素细粒度并行、工作项与数据的空间映射和本地存储器优化方法的应用,使矩阵转置算法在GPU计算平台上的性能提高了12倍.实验结果表明,与基于CPU的串行算法、基于开放多处理(OpenMP)并行算法和基于统一计算设备架构(CUDA)并行算法性能相比,矩阵转置并行算法在OpenCL架构下NVIDIA GPU计算平台上分别获
其他文献
对一类圈上有奇数个节点的太阳图进行边魔幻优美标号研究,得到了其超级边魔幻优美标号和边魔幻全标号,并对特殊的广义太阳图确定了其边魔幻优美标号和边魔幻全标号.提出了一种新
在农村网络购物消费需求的刺激下,发展农村电子商务对于提高农村居民生活质量、加快农村信息化建设和进一步推动电子商务的发展具有重要的现实意义。本研究拓展并丰富了农村
提出了一种有效处理冲突证据的融合方法.该方法综合考虑了D-S证据组合规则的不足及修正数据源方法的可靠性高的特点,首先引入证据距离对冲突证据进行检验;然后计算冲突证据在
从耕地破碎化程度入手,以吉林省长春市九台区为研究对象,结合相关研究及研究区实际情况选取面积、形状、分布三方面共6个评价指标构建了耕地破碎度评价体系,运用层次分析法和
目的:探讨延续性护理在改善慢性心力衰竭患者生活质量和自我管理能力中的临床意义。方法:将130例患者随机分为观察组和对照组,每组各65例。对照组采用常规护理进行干预,观察组