面向深度学习推理的矩阵乘法加速部件设计

来源 :计算机工程 | 被引量 : 0次 | 上传用户:huahua_yang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
通用矩阵乘优化大多面向大规模稠密矩阵(>=1000),不能很好满足深度学习推理中更小规模且形状不规则的矩阵乘法计算需求。研究显示,深度学习推理可以只使用整数计算完成,降低了保持可接受推理精度的计算和存储带宽需求。为此,提出一种基于Zynq SoC平台的整数矩阵乘法设计。方案采用基于总线广播的并行结构。通过充分利用片上数据重用性和最小化中间结果数据移动,以达到高性能的同时尽量降低外部DRAM访问需求;通过支持可变矩阵分块设计,使加速部件在计算形状不规则的矩阵乘时保持高效率。测试结果表明,与双核ARM Cortex-A9 CPU的DeepBench通用矩阵乘测试结果相比,该设计可达到8.4倍的性能加速。
其他文献
双工器把每个接收和发射频带各分为两个225兆赫的频带,并由一个40兆赫的防护频带把上述两个信道分隔开来。接收双工器是一个4端装置,输入和输出各有2端。其中一个输入端接于
在华北地台北缘中新生代火山岩发育区,发现大型铀钼矿床,其外围被第四系广泛覆盖。为了进一步扩大找矿,我们采用了以遥感图象、地质图件、航磁、航放资料为基础信息的多元信
经过春节期间的一番大鱼大肉,人们转眼对蔬菜类情有独钟。在此介绍几道白菜的烹饪方法。白菜有大白菜和小白菜之分,大白菜原产中国,有五千年历史。1875年移植日本,1920年又在
"三农"问题是以农民为主体、以农村为地域、以农业为纽带相互交织成一体的农民、农村、农业问题的总称。中国作为一个农业大国,"三农"问题关系到人民生活、国民素质、经济发展,关
康德的教育学是研究怎样教育的实践教育学。在他的实践教育学中,教育是一种艺术。不过,康德并没有对什么是教育艺术给予明确和清晰的回答,学术界对康德的教育艺术概念亦缺乏
翻译过程中,充分考虑语境--上下文语境、文化语境和情境,不仅可以使译者正确捕捉话语的核心,更好地理解原文,同时也有助于准确地表达原文的内容、风格,使译文接受者获得与原
在《爱弥儿》一书中,卢梭对洛克的《教育漫话》提出诸多批评。在卢梭眼里,洛克的绅士教育思想存在着明显的实用主义倾向,其试图培养的绅士本质上是一个追逐私人利益、实现自
燃气作为一种广泛使用的能源,在居民的日常生活中起到重要的基础性作用,但是在实际生活中,城镇燃气方式在趋具完善的基础上仍然存在一定问题,文章将立足于实际生活,对城镇燃