基于GPU的矩阵乘法优化研究

被引量 : 0次 | 上传用户：wow32167

【摘要】

：

传统单核处理器的性能由于散热、功耗等问题,已无法与硬件资源发展速度相适应,但近几年来高性能计算领域的新兴应用的发展对计算机的性能要求却越来越高。相对于传统的单核处

【作者】

：

殷建

【发表日期】

：

2015年期

【关键词】

：

GPU 稀疏矩阵乘法稠密矩阵乘法算法优化

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

传统单核处理器的性能由于散热、功耗等问题,已无法与硬件资源发展速度相适应,但近几年来高性能计算领域的新兴应用的发展对计算机的性能要求却越来越高。相对于传统的单核处理器,多核/众核处理器可利用线程级并行获得性能提升,从而更好地满足高性能计算领域对计算机的性能要求,目前已被学术界和产业界广泛接受。然而,多核／众核平台虽拥有较高的浮点峰值和计算能力,但它的结构和编程环境具有一定复杂性,如何充分挖掘众核处理器的强大计算能力便成为了一个突出的问题。为了解决该问题,探索众多应用中的核心算法,并针对多核／众核平台特点对其进行优化便显得尤为重要。本文以稠密矩阵向量乘法(The matrix-vector multiplication routine for general dense matrices,GEMV)、稀疏矩阵向量乘法(sparse matrix-vector multiplication,SpMV)作为规则应用核心算法与非规则应用核心算法的代表进行研究：(1)采用面向众核GPU的高速缓存分块方法设计更优的基于众核GPU稠密矩阵向量乘算法,第一种算法从提高线程并行度的角度出发,能够很好的提高GPU的利用率。利用同一个warp的线程代替传统高速缓存算法中一个线程,计算向量y中的一个对应元素。第二种算法,在第一种算法的基础上加入了寄存器上数据重用的思想。寄存器资源是是GPU众核平台上最为快速的资源,是解决访存瓶颈问题有效途径。通过实验对比分析,新的算法较传统库函数有着很好的性能提升,尤其是对小型和行数大于列数的矩阵,性能提升了10%以上。此外,本文针对GPU众核架构特点对寄存器重用次数对算法性能影响也进行了进一步研究。(2)HYB存储格式基础上提出新的存储格式对稀疏矩阵向量乘进行优化,通过多次划分使稀疏矩阵的COO存储格式部分更小,并增加ELL格式的部分,以更好地利用众核GPU的计算能力。此外,我们在实验过程中对划分参数进行了仔细分析,调优后的结果进一步的提升了算法性能。实验结果表明,与传统的基于HYB格式的算法比较,基于HYB-Ⅰ格式的稀疏矩阵向量乘法在我们的稀疏矩阵测试集上获得了更高的性能,最好的情况下性能提升比达到17%(3)针对稀疏矩阵向量乘法提出新的基于BCSR格式的高速缓存分块方法,对稀疏矩阵进行划分并以CSR格式进行存储,利用高速缓存分块思想,将向量x在共享内存中多次利用,有效地提高了了访存效率,使稀疏矩阵向量乘法性能得到提升。实验表明,最好情况下,稀疏矩阵向量乘的高速缓存分块方法比CSR格式计算结果的速度有5倍的提升。

其他文献

高龄髋关节置换手术后康复训练及护理

目的探讨高龄髋关节置换手术后康复训练的疗效。方法回顾分析196例髋关节受损后肌肉收缩训练、关节活动和站立行走训练的方法。结果髋关节脱位3例,髋关节活动明显下降8例,191

期刊

高龄髋关节置换康复训练护理

RNAi技术在大规模基因功能研究中的应用

由双链RNA诱导的基因沉默现象称为RNA干涉(RNAi)。RNAi的高效率、高特异性以及能在细胞内简易地进行人工诱导,特别是在哺乳动物细胞内成功诱导RNAi及成功应用表达载体等,使RN

期刊

RNA双链反向遗传技术基因沉默

商品混凝土行业特点与竞争优势分析

一个时期以来,水泥行业面对的关键词大都以转型、淘汰、重组和延伸有关。一些水泥企业纷纷试水混凝土产业,如何把好混凝土产业发展的脉搏成为相关企业关注的话题。本文通过对

期刊

商品混凝土行业比较优势核心竞争力预拌混凝土企业水泥行业商品混凝土企业优势分析

南水北调配套工程顶管施工技术研究

顶管工程是一种暗挖施工方法,广泛应用于市政工程、水利工程,顶管内穿钢管施工是顶管工程施工的一个关键工序.以南水北调配套工程的某施工标段顶管工程为例,研究了顶管内穿钢

期刊

顶管内穿钢管滑轮组自密实混凝土

浅析行为场所理论在校园环境设计中的应用——以沈阳建筑大学新校区的几个场所设计为例

行为场所理论是行为科学在环境设计中取得的重要进展之一,主要是研究人的外显行为,并将人的行为模式与物质场所联系起来作为整体研究,描述了人与场所之间的的内在联系。文中

期刊

行为场所理论沈阳建筑大学公共空间场所行为活动

骨保护素对高龄骨质疏松症患者骨代谢的影响

目的观察骨保护素(OPG)对高龄骨质疏松症患者骨代谢的影响。方法纳入2009年7月-2014年7月于浙江医院体检并经骨密度测定确诊的高龄骨质疏松症患者150例,另选取高龄非骨质疏松

期刊

老年人骨质疏松骨保护素

1978—2013年云南职业教育研究综述

梳理国内30多年来云南职业教育的研究成果发现,已有研究成果覆面广;研究视角多维、研究方法综合化;研究人员多元、研究受重视。不足之处是研究成果总量偏少、存在研究盲点;研

期刊

云南职业教育研究成果评述

高考一年多考实证研究:计量经济学的方法——来自武汉市蔡甸区实验高中的调考数据

部分科目一年多考是高考改革的重要议题。本文将武汉市高三年级调考视作高考,通过建立数学模型,对武汉市蔡甸区实验高中高三学生2013年2月和4月的两次调考成绩进行回归,发现

期刊

高考学业水平考试改革计量经济学实证研究

健康信念模式对PICC置管患者焦虑抑郁程度的影响

目的:探讨健康信念模式对PICC置管患者焦虑抑郁的影响。方法:选择2009年6月~2010年12月留置PICC的36例患者作为对照组,采用常规健康教育方法;选择2011年1月~2012年6月留置PIC

期刊

健康教育健康信念模式外周静脉穿刺中心静脉焦虑抑郁

传媒与政治的关系研究

传媒自由是从言论自由引申而来的一个概念。它以西方自由主义哲学为基础,意为传媒业脱离政治权力的束缚,按照自身运行的规则独立地生存于社会当中。对于传媒获取自由的方式,

学位

传媒政治分离技术市场制度

基于GPU的矩阵乘法优化研究

其他学术论文