【摘 要】
:
向量化算法映射是向量处理器的难点问题。提出一种高效的支持原位计算的三角矩阵乘法向量化方法:将L1D配置为SRAM模式,用双缓冲的乒乓方式平滑多级存储结构的数据传输,使得内
论文部分内容阅读
向量化算法映射是向量处理器的难点问题。提出一种高效的支持原位计算的三角矩阵乘法向量化方法:将L1D配置为SRAM模式,用双缓冲的乒乓方式平滑多级存储结构的数据传输,使得内核的计算与DMA数据搬移完全重叠,让内核始终以峰值速度运行,从而取得最佳的计算效率;将不规则的三角矩阵乘法计算均衡分布到各个向量处理单元,充分开发向量处理器的多级并行性;将结果矩阵保存在乘数矩阵中,实现原位计算,节省了存储空间。实验结果表明,提出的向量化方法使三角矩阵乘法性能达到1053.7GFLOPS,效率为91.47%。
其他文献
传统的网络控制理论在研究网络规模较大,链路权重巨大的网络时计算量过于庞大,对有向网络的研究也是难点之一。文章通过研究结构上可控制的理论,提出基于关键节点控制整个有向网
【正】 什么是籍“籍”与每个公民都有着密切的关系,但大多数人对它的法律含义知之甚少。新宪法虽巳颁布多年,但在籍的同题上公然践踏公民基本权利的事件仍时有所闻。甘肃省
【正】 中外合资经营的生产型企业利用国外的先进技术与管理经验,生产出在国际市场具有竞争能力的产品后,必须将产品销往国外,并以外销利润使合营企业的外汇取得平衡。一般来
精准扶贫这一伟大举措的提出者,前无古人。习近平总书记在2013年11月湖南湘西考察时首次做出了“实事求是、因地制宜、分类指导、精准扶贫”的重要指示。“两不愁三保障”的提
构造分类器是图像分割中重要的处理环节,论文将先验知识引入支持向量机,对支持向量机做了改善,在改善的支持向量机基础上构造实现了一个分类器,重点是将为了检验分类器的有效性,通过对UCI机器学习数据库的数据进行的实验,实验结果表明改善的支持向量机分类准确率比支传统持向量机的准确率高。
地铁为人们的出行提供便利,也改变了人们的生活方式。但是,不容忽视的是,高峰期地铁乘车依然是很多人所困扰的问题,该时段不仅乘车效率下降,而且难以让人们享受地铁的方便作用。因
当母牛初情期后,卵泡成熟和排卵在激素的作用下发生规律性的变化。人们把这种现象称作性周期,奶牛的性周期一般为18~25天,平均21天。根据本试验50头次的统计,性周期为18~26天,
2006年某锅炉安装公司承建了河北华瑞2×24MW热电工程,该工程的锅炉型号为CG-130/9.81-M。其参数为:额定蒸发量130t/h,过热蒸汽压力9.81MPa,过热蒸汽温度540℃。锅炉屏式过热器的
【正】 在民事审判实践中,审判人员不仅要查明引起民事纠纷的种种具体情况,还要注意了解和掌握诉讼当事人的心理特征,以事实和法律为依据,有的放矢地做好当事人(特别是原、被
用不同的强度校核方法,对一台100MW发电机组锅炉(额定蒸发量410t/h)主给水管道弯头的强度进行了计算、比较,对不同校核方法产生结果差异的原因进行了分析,从而得出既安全又切合