缓存结构GPU矩阵乘法算法的自动优化

来源 :现代电子技术 | 被引量 : 0次 | 上传用户：seelo1332

【摘要】

：

讨论在Fermi结构GPU使用CUDA对GEMM（单精度和双精度）算法进行优化，以及Fermi体系结构的新特性（如缓存）对性能的影响。GPU缓存一方面可以提高处理器在运行时数据访问的局部性，另一方

【作者】

：

李晓雯崔翔殷瑞杰刘强

【机构】

：

防空兵学院指挥控制系,河南大学计算机与信息工程学院

【出处】

：

现代电子技术

【发表日期】

：

2014年10期

【关键词】

：

GPU程序设计矩阵乘法自动优化 GEMM模板 GPU programming matrix multiplication automatic optimiz

【基金项目】

：

国家自然科学基金（61240045）,博士后科学基金（2013M540821）,河南省教育厅科学技术研究重点项目（13A520065）

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

讨论在Fermi结构GPU使用CUDA对GEMM（单精度和双精度）算法进行优化，以及Fermi体系结构的新特性（如缓存）对性能的影响。GPU缓存一方面可以提高处理器在运行时数据访问的局部性，另一方面使得代码性能对与性能相关算法参数的依赖变得不可预测。自动优化技术可以用来解决这一问题。自动优化的SGEMM和DGEMM代码在Tesla C2050 GPU上达到了563GFlops和253GFlops的性能。代码使用CUDA和C语言进行实现，未进行二进制代码级别的优化。

其他文献

BFRP筋钢纤维部分增强再生混凝土梁抗弯性能研究

设计了7根BFRP筋钢纤维再生混凝土梁,研究了钢纤维体积掺量(vsf)和钢纤维混凝土层厚度(hsf)对试验梁抗弯性能的影响,分析了各试验梁受弯破坏模式、承载力变化、裂缝发展及挠

期刊

再生混凝土梁BFRP筋钢纤维受弯承载力钢纤维再生混凝土层厚度recycled concrete beamBFRP barsteel fiberf

云计算与安全@@@@云计算环境中一种基于Hash环的P2P网络模型研究

P2P技术的应用在现代网络系统中越来越普及，而云计算的出现给IT界带来了全新的挑战，因此，针对目前网络的发展现状，对P2P技术和云计算技术进行研究，提出了一种云计算环境中的P2P网

期刊

云计算P2P技术网络模型Hash环网络资源搜索cloud computationP2P technologynetwork modelHash

一种消除光照影响的舰船跑道区域增强方法

光照过强或者过弱都会对舰船跑道直线提取造成严重影响,导致跑道直线提取不完全甚至失败。针对上述情况,提出了一种图像处理算法来消除光照带来的影响同时增强跑道直线的算法。首先将图像灰度均值恢复到光照合适时的水平,然后用一种线性灰度变换算法增大图像的动态范围和对比度,并且根据图像质量改善情况的反馈对这两步多次迭代,直至得到较好的图像跑道增强效果。仿真实验证明该算法较好地消除了光照变化带来的不利影响,并实现

期刊

光照影响消除图像处理线性灰度变换算法舰船跑道illumination influence eliminationimage processingli

纤维增强塑料（FRP）管混凝土性能的研究

本文通过对纤维增强塑料管混凝土试件的三点抗弯试验，讨论了荷载－位移关系、荷载－挠度关系、跨度－曲率关系、跨度－破坏弯矩关系、跨度－应力关系。试验结果指出，采用±４５度交叉缠绕

期刊

混凝土纤维增强塑料管力学性能

低碳理念下的建筑装饰装修全过程管理

在建筑装饰装修工程中融入低碳理念,科学利用环保型材料和技术,减少了高能耗、高污染问题,有助于实现可持续发展目标。文章阐述了低碳理念和其在建筑装饰装修中应用的重要性,

期刊

低碳理念建筑装饰装修全过程管理

领会国家政策与实施细则，做好混凝土输水管产品换（发）证取证工作

分析了<混凝土输水管产品换(发)生产许可证实施细则>与原混凝土输水管产品生产许可证实施细则的区别,阐述了混凝土输水管换 (发 )证工作程序,介绍了国家对混凝土输水管生产企

期刊

混凝土输水管自应力混凝土产品质量

缓存结构GPU矩阵乘法算法的自动优化

其他学术论文