面向SMP的模板计算访存优化研究

来源 :国防科学技术大学 | 被引量 : 0次 | 上传用户：anan9077

【摘要】

：

共享存储多核多级Cache结构已成为高性能计算领域通用的处理器架构。虽然多级Cache结构能够有效缓解“存储墙”,但在科学计算程序中,访存指令占有较大比重,访存效率仍然很低,

【作者】

：

董钰山

【机构】

：

国防科学技术大学

【出处】

：

国防科学技术大学

【发表日期】

：

2015年期

【关键词】

：

模板计算 SMP 多级Cache 循环分块 SIMD 向量重组数据预取

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

共享存储多核多级Cache结构已成为高性能计算领域通用的处理器架构。虽然多级Cache结构能够有效缓解“存储墙”,但在科学计算程序中,访存指令占有较大比重,访存效率仍然很低,而且多核并行对访存带宽有更高的需求。因此,减少访存次数和隐藏访存延迟仍然是程序访存优化研究的主要内容。模板计算是一类在图像和视频处理、大规模科学和工程计算等领域广泛使用的访存密集型计算核心,已被众多科研工作者作为性能优化的对象,包括并行加速、通信优化、负载平衡等,而对模板计算的访存优化还需要进一步研究。本文以共享存储多核处理器为平台,从循环分块、向量重组和数据预取三个方面对模板计算进行了访存优化研究,主要贡献及创新包括三个方面:第一、改进了传统的循环分块方法,并提出一种基于OpenMP线程与数据块绑定的并行算法。改进的循环分块方法综合考虑了多核或多线程并行及多级Cache结构的特性;基于OpenMP线程与数据块绑定的并行算法能够有效的解决传统并行算法中并行开销大、不能有效重用相邻分块之间的边界数据等问题。第二、采用向量重组减少模板计算的非对齐访存,并提出一种向量拼接移位的向量重组方法。通过对模板计算访存特点的分析,发现模板计算不仅可以进行向量化,而且一些向量之间存在数据元素的重用。所以在模板计算向量化的基础上,采用向量重组方法减少了模板计算存取数据的次数,有效提升了模板计算的访存效率。在模板计算向量重组方法的研究中,不仅基于模板计算的访存模式提出多种向量重组方法,而且基于模板计算重组向量的特点提出向量拼接移位的向量重组方法,减少了向量操作次数。第三、采用数据预取隐藏模板计算中的访存延迟。数据预取充分利用处理器空闲带宽对数据进行存取,通过将访存与计算重叠,能够有效地隐藏访存延迟。通过对Intel X86₆4硬件预取和软件预取机制的分析,分别对连续访存和非连续访存两种模式下的模板计算使用了软件预取优化,并使用循环展开和循环剥皮优化了数据预取。实验结果表明,软件预取更有益于优化非连续访存模式下的模板计算。

其他文献

协同CAD系统中并发控制的研究

近年来由于计算机技术在工程设计领域的广泛应用,使CAD(计算机辅助设计)技术迅速发展起来。协同CAD系统是CSCW技术的一个典型应用。它支持不同地理位置的多个设计者通过分工

学位

协同设计并发控制特征依赖关系并发冲突

链路状态感知的空间网络文件传输机制研究

由于空间网络相较于传统地面网络具有长传播时延、高误码率、带宽不对称,连接易中断的特点,现有的传输机制难以满足其高效传输的要求。本文针对空间网络的特点,通过将链路状

学位

空间网络链路状态感知负确认重传文件传输

基于一致性hash与二级索引的虚拟资产保全系统优化的研究

近年来,随着信息技术的蓬勃发展,社交网络、电子商务,网络游戏等已经成为一种重要的市场行为,随之而来的是网域空间虚拟资产数据的巨大增长。虚拟资产保全系统旨在对这些海量

学位

虚拟资产Cassandra数据库一致性hash二级索引

普适计算环境下基于Agent的数据流处理机制研究

随着计算机及其相关技术的发展，通信能力和计算能力的价格正变得越来越便宜，各种新形念的传感器所占用的体积也越来越小。由于对生产效率、生活质量的不懈追求，人们开始希望能随

学位

普适计算数据流处理移动Agent路径迁移算法服务质量音乐智能播放

蚁群算法在WSN分层路由中的应用研究

近年来，无线通信和电子技术的不断进步，促进了微型无线通信传感器节点的长足发展。由这些低功耗、多功能的节点所构成的无线传感器网络具有十分广阔的应用前景，目前已成为计算机

学位

蚁群算法分层路由无线传感器网络路由协议

基于网格模型的孤立点检测算法

数据挖掘技术是从上个世纪80年代开始发展起来的一门新技术,就是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们事先不知道的、但又是

学位

数据挖掘孤立点网格模型

结合可视化与机器学习的网络异常检测技术研究

随着网络技术的不断发展，互联网的普及率以及网民的数量的不断攀升，给人们的学习和日常生活带来了极大的便利。与此同时，针对网络的攻击手段日益复杂，网络攻击软件日趋多样，网络安

学位

可视化技术异常检测机器学习网络安全

移动代理迁移策略研究及其在IDS中的应用

随着计算机和网络技术的飞速发展,计算机安全问题日益突出。入侵检测是计算机安全体系结构中的一个重要的组成部分。目前入侵检测系统的研究已经有了长足的进步,开发出了许多

学位

入侵检测系统移动代理迁移策略蚁群算法

基于层次分解决策树的脱机手写体汉字识别研究

脱机手写体汉字识别由于其字符集庞大，字形变化多等特点成为模式识别领域一个极具挑战性的课题。它将在信函分拣、银行支票识别、统计报表处理以及手写文稿自动输入等诸多方面

学位

收集表格弹性网格笔画分解决策树汉字识别

基于多约束关系的安全授权分析与验证

访问控制是保护信息资源的一种重要机制,通过对用户访问行为的限定从而达到保护敏感信息的目的。因此,实施合适的访问控制是构建安全信息系统的基本要求。访问控制通常依据一

学位

访问控制授权安全约束验证

面向SMP的模板计算访存优化研究

其他学术论文