【摘 要】
:
半导体技术的飞速发展使微处理器的运算能力迅速提升,但访存速度的增长却相对缓慢,“存储墙”问题日益明显。存储系统有限的片外带宽已经成为阻碍程序整体性能提升的瓶颈。分
论文部分内容阅读
半导体技术的飞速发展使微处理器的运算能力迅速提升,但访存速度的增长却相对缓慢,“存储墙”问题日益明显。存储系统有限的片外带宽已经成为阻碍程序整体性能提升的瓶颈。分片式流处理器主要面向数据并行应用,这类应用的访存时间通常占据程序整体运行时间的很大比例,同时传统的存储系统结构设计也并不适应这类应用的访存特点,因此这个问题更加严峻。改进访存系统从而减少访存开销对提升分片式流处理器系统的性能非常重要。在片外数据传输峰值带宽固定的情况下,提高片外存储访问带宽的使用效率,减少计算代码的等待时间是提升存储系统性能的关键途径之一。论文的研究工作着眼于分片式流处理器的数据并行存储系统的分析、设计和实现。主要研究内容和成果包括以下几方面。(1)基于流处理器的数据并行存储系统访存模型、结构特征以及数据并行应用的访存特点,定性地分析了其多级存储层次和计算/访存重叠对隐藏延迟、改善带宽的效果。(2)在模拟实验平台上定量地测试和分析了在不同负载特征下,存储系统的主要设计参数对访存性能的影响。实验表明,对于访存模式敏感的部分参数,需要根据不同应用的并行性和局部性特点来配置它们以改善性能。(3)从提高片外带宽使用率的角度出发,设计和实现了分片式流处理器的数据并行存储系统。该存储系统通过多级调度能有效地减少片外访存的次数,降低片外带宽需求。软件模拟和仿真验证的结果表明,在不同工作负载特征下,通过设计参数的优化选择,该设计能够充分挖掘存储访问的行局部性和体间并行性,提高带宽的使用效率,从而促进整个分片式流处理器系统的性能提升。
其他文献
随着广泛应用的多媒体业务对网络带宽的需求越来越大,网络带宽瓶颈显得越来越突出。服务质量(QoS,Quality of service)是解决这一问题的一个可选方案。本文在分析用户需求的
Web服务组合框架及相应平台开发的研究是目前面向服务计算的重要研究内容。现行Internet平台下的Web服务组合技术面临着多方面的挑战,如Web服务的被动性、协同方式单一、集中
生物认证技术是利用人体固有的生理特征,如人脸、虹膜、指纹、以及行为特征,如步态等对个体进行识别的身份认证技术。近几年来,由于对安全问题的重视,生物认证技术得到了长足
智能规划已经成为人工智能的一个研究热点,特别是规划图方法(GraphPlan)的提出更是使智能规划的研究取得了革命性的进展。随后的许多规划器都是在此基础上的,如1999年提出的P
近年来,随着现代通信技术的飞速发展和计算机互联网技术的迅速普及,信息的共享、传播变得尤为重要。它给人们带来种种便利的同时也带来了一系列的信息安全问题,比如信息窃取
随着计算机技术、通信技术和半导体技术的快速发展,物联网成为新一代信息技术的重要组成部分。作为物联网中的一个重要组成部分,无线传感器网络应用也越来越广泛,与此同时,对
当今世界,高新科技的迅猛发展深刻地改变着整个世界的面貌,推动着整个世界的经济、社会、文化持续快速向前发展。整个世界已凸显全球化、信息化和知识化的特征。世界正变得越
制造网格的出现,实现了地理上分散的各类制造资源的全面连通和共享,形成了一个庞大的资源库。用户想要像使用本地资源一样方便地使用资源库中的资源,必须有效的发现所需的资
当今对图像、视频、药物分子、文本、空间数据、基因等数据的高阶高维信息规律进行分析是目前机器学习、数据挖掘等领域迫切需要解决的问题之一。相对传统的向量化的数据分析
C语言试题库是学校C语言考试系统的基础。由于常年的使用以及原系统缺乏重复试题检查功能,在试题库的不断扩充下题库里难免存在大量重复试题,这样就导致了试卷质量和考试效果