【摘 要】
:
随着工艺技术的发展,现场可编程阵列(Field Programmable Gate Array,FPGA)的片上容量不断增加,良好的并行性、可重构、低功耗等特性使FPGA成为实现可重构计算的关键部件之一
论文部分内容阅读
随着工艺技术的发展,现场可编程阵列(Field Programmable Gate Array,FPGA)的片上容量不断增加,良好的并行性、可重构、低功耗等特性使FPGA成为实现可重构计算的关键部件之一。随着嵌入式应用的不断深入以及规模的不断扩大,应用的加速需求也不断增加,FPGA在加速应用方面的独特优势使其得到了国内外的广泛关注。矩阵计算是科学和工程计算的核心,而矩阵乘又是最基本的矩阵运算之一,常被应用于图像处理,电子通信,材料科学模拟,数据挖掘等应用领域。由于大规模矩阵乘算法计算复杂度高、处理效率低,往往成为限制系统性能的瓶颈所在。因此,矩阵乘算法的FPGA加速一直是嵌入式领域的研究热点。本文提出了一个基于FPGA的高性能、高存储效率的浮点矩阵乘加速器设计,该设计充分利用了Xilinx公司的IP核性能优势,提升了片上计算、存储以及带宽资源的利用效率。此外,本文针对链式矩阵乘加速器在加速非均匀矩阵乘出现的计算效率低的问题,提出了一种优化分块技术,通过构建数学模型计算出最优分块,进一步提高矩阵乘加速器的计算效率。我们在MASA-CLUSTER平台上实现了我们的矩阵乘加速器设计,实验结果表明,我们的设计达到了98%以上的计算效率,并且在128个计算单元以及150 MHz的工作频率下,实测性能可达到19 GFLOPS。此外,我们的设计还具备良好的可扩展性。我们对卷积神经网络中的非均匀矩阵乘采用了优化分块技术,结果表明我们的分块技术可以提升矩阵乘加速器12%的计算效率,为加速应用提供了良好的支持。
其他文献
<正>在北京四环边上的一家咖啡馆,环球人物杂志记者见到了从机场赶来的王福重,他刚刚结束一场在外地的讲座。现在很多人愿意听他解读财经问题,不仅仅因为他是研究经济学和金
新时期以来,乡下人进城成为一股迁徙潮流,随之而来的是反映乡下人在城市中的生活状态的文学作品不断涌现,丰富着当代文学的殿堂。作为一个有责任感的河南乡土作家,李佩甫创造了一
从单味中药治疗、中药复方治疗、中药与其他方法联用治疗3方面综述了近10年来中医药对神经衰弱的研究进展 发现近年来对此方面的研究多集中在临床研究上,据此对其临床研究提
针对含蓄电池作为储能元件的风电直流微网系统,提出了能够衡量储能系统老化过程的能量管理模型。该模型通过纳入蓄电池健康状态实现了系统的经济运行,通过功率平衡约束保证系
PL铜矿项目是云铜的一个重要矿山建设项目,目前已探获远景储量480万吨。由于地处高原,毗邻风景名胜,PL铜矿建设面临着环境保护、地方关系协调、采矿方式选择、自然灾害防范等
<正>邓铁涛是广州中医药大学终生教授,生于中医世家,自幼侍诊父侧,执庭训秘旨,悬壶济世,从事教学、医疗、科研工作已60余载。邓教授在20世纪80年代提出了岭南医学的观点,并明
有机激光材料凭着其成本低廉、加工简单、出射波长可调谐等优点引起了研究人员的浓厚兴趣。第一台光泵浦固态有机半导体激光器的问世更让研究人员相信电泵浦有机激光器件也会
随着国内以LED产业为代表的半导体产业的迅猛发展,我国对MOCVD设备的需求量不断增大。但是目前我国的MOCVD设备主要来自于国外,价格昂贵。在这样的行情下,我国将MOCVD设备技
教育的发生,主要来源于两个方面:一是人的生存需要,一是人的发展需要。前者多表现为社会对人的现实要求,呈现方式为“人必须接受教育”,否则生存就有危机;后者多表现为对自我
多路脉冲的ns级同步技术在国防、工业、医疗和环保等众多领域有着非常广泛的应用前景。传统多路同步技术采用气体开关、磁开关、半导体开关和激光触发开关作为导通开关。电极