3D-MMA:基于3D集成电路的矩阵乘加速结构

来源 :计算机工程与科学 | 被引量 : 0次 | 上传用户：wymanszeto

【摘要】

：

脉动阵列结构规整、吞吐量大,适合矩阵乘算法,广泛用于设计高性能卷积、矩阵乘加速结构。在深亚微米工艺下,通过增大阵列规模来提升芯片计算性能,会导致频率下降、功耗剧增等

【作者】

：

王吉军郝子宇李宏亮

【机构】

：

江南计算技术研究所

【出处】

：

计算机工程与科学

【发表日期】

：

2019年12期

【关键词】

：

3D集成电路矩阵乘分块算法性能模型 3D integrated circuits matrix multiplication accelerator bl

【基金项目】

：

国家科技重大专项(2018ZX01028-102)

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

脉动阵列结构规整、吞吐量大,适合矩阵乘算法,广泛用于设计高性能卷积、矩阵乘加速结构。在深亚微米工艺下,通过增大阵列规模来提升芯片计算性能,会导致频率下降、功耗剧增等问题。因此,结合3D集成电路技术,提出了一种将平面脉动阵列结构映射到3D集成电路上的双精度浮点矩阵乘加速结构3D-MMA。首先,设计了针对该结构的分块映射调度算法,提升矩阵乘计算效率;其次,提出了基于3D-MMA的加速系统,构建了3D-MMA的性能模型,并对其设计空间进行探索;最后,评估了该结构实现代价,并同已有先进加速器进行对比分析。实验结果

其他文献

3D-MMA:基于3D集成电路的矩阵乘加速结构

其他学术论文