【摘 要】
:
矩阵-向量乘法算法的时间复杂度大,传统计算方法的实时性和跨平台性难以保证.本文提出一种基于开放式计算语言(Open Computing Language,OpenCL)的矩阵-向量乘并行算法,矩阵-
【机 构】
:
郑州师范学院信息科学与技术学院; 郑州大学信息工程学院;
【基金项目】
:
国家自然科学基金项目(61572444,61250007)资助
论文部分内容阅读
矩阵-向量乘法算法的时间复杂度大,传统计算方法的实时性和跨平台性难以保证.本文提出一种基于开放式计算语言(Open Computing Language,OpenCL)的矩阵-向量乘并行算法,矩阵-向量乘法过程被分解成若干具有不同粒度的子任务.根据相应的并行度,每个工作组进行矩阵中的行块与列向量的乘积,每个工作项进行行块中行向量与列向量的乘积,并把计算任务分别分配到计算单元和处理单元进行处理.实验结果表明,与基于CPU的串行算法、基于OpenMP并行算法和基于统一计算设备架构(Compute Unified Device Architecture,CUDA)并行算法性能相比,矩阵-向量乘并行算法在OpenCL架构下NVIDIA图形处理器(Graphic Processing Unit,GPU)计算平台上分别获得了20. 86倍、6. 39倍和1. 49倍的加速比.验证了提出的并行优化方法的有效性和性能可移植性.
其他文献
旧石器时代,人类因具备抽象思维能力而开启了"崇拜"之旅。从最早期的大自然崇拜,进化而对草木虫兽等精灵崇拜,逐渐衍化为图腾崇拜,然后抽象并升华为精神崇拜,再进化到英雄崇拜
目的 评价我院70岁以上患者使用万古霉素的情况.方法 选择37例应用万古霉素治疗的患者,年龄均〉70岁.采取回顾性分析方法,对患者所做的病原学检查、药物敏感试验、基础疾病、
目的:探讨距骨骨折并发症的治疗方法及疗效。方法:回顾性分析我中心自2006年9月~2009年9月计收治距骨骨折术后6例产生了不同类型、不同程度的并发症,分别经清除死骨、核心减压术
学分制对于本科教育来说是一种新型的教学管理制度.目前,国内学分制下本科生培养质量评价体系研究尚处初级阶段,面对体量巨大的任务,实施起来颇有难度.基于因子分析法和德尔菲法构
目的:观察光动力联合甘草锌治疗寻常型痤疮的临床疗效。方法:将符合纳入标准的60例寻常型痤疮患者随机分为两组。其中治疗组32例予光动力联合甘草锌治疗,对照组28例仅予光动
从航空活塞发动机设备检修的实践问题入手,讨论了航空活塞发动机检修实践现状以及开发、利用途径,以提高航空活塞发动机的检修水平,确保活塞发动机正常、稳定地工作,以保障飞
<正> 无毛独根草(变种) Oresitrophe rupifraga Bunge var. glabrescens W. T. Wang,var. nov. A var. rupifraga differt foliis et scapis cum inflorescentiisglabris. 河
课程的类别和层次理论关于语文课程性质的各种讨论,多是将语文课程某一层面或某一类别看作语文课程的全部,以对局部问题的分析结果作为整体的性质加以考察。“横看成岭侧成峰,远