面向FT1000微处理器的STREAM并行计算与优化

来源 :计算机工程与科学 | 被引量 : 0次 | 上传用户:gennie_g
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
STREAM是微处理器上内存性能的基准测试程序,在多核多线程FT1000微处理器上发挥高性能是具有挑战性的研究工作。基于多级Cache结构,优化STREAM四个程序的指令流水线,根据寄存器数,设计了多级循环展开方法,根据指令延迟和Cache行的大小确定数据预取的数目,使用汇编语言编写了优化子程序。基于OpenMP并行环境,设计了STREAM并行程序,优化了局部化数据分配方式。数据测试结果表明,优化后的STREAM的性能比原始串行程序性能提高了19.2%-64.2%。优化后,并行程序的最高访存性能达到8.5
其他文献
立足当前军校本科学员对计算机类课程学习缺乏兴趣和动力的教学现状,对教学理论中兴趣产生的一般规律进行了分析和研究。在遵循现代教学原则的基础上,针对如何培养学生的学习兴
机会网络的数据交换不需要完整的路径,且传递数据是基于节点机会移动和机会相遇.相对于传统网络来说,达到了绿色节能的目的.但是,机会网络中节点逐跳传递数据存在较大的传输