面向图搜索的细粒度统一编址并行架构设计实现与协同优化

来源 :国防科学技术大学 | 被引量 : 0次 | 上传用户:rongtian2588
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
大数据时代到来,数据规模的快速增长和应用的高时效处理需求对处理器结构和并行计算机系统结构提出了新的巨大挑战。图搜索问题是大数据研究的热点问题,被广泛应用于科学研究的各个领域。课题在分析图搜索问题负载特性的基础上,基于课题组设计的单节点处理器结构,进一步研究和实现了面向图搜索的多节点并行处理系统以及并行BFS算法的设计,并开展软硬件协同优化研究。针对图搜索问题访存全局细粒度不规则的特性,课题设计实现了细粒度统一编址的并行架构,设计实现了分布共享内存的多节点系统,并基于专用高速通信接口设计实现了节点间细粒度访存接口,实现细粒度全局内存访问。课题搭建了8节点原型系统平台,在其上设计实现了基于1-D划分的并行BFS算法,分析了算法数据结构设计和访存模式,以开展协同优化。课题设计实现了多节点并行BFS算法模拟器,模拟算法并行执行过程,验证算法正确性并获取算法执行参数。为优化系统整体执行性能,课题进一步开展系统性能测试与协同优化。针对测试结果分析,课题从系统的远程访存、本地访存以及全局通信设计三个方面开展软硬件协同优化,在8节点原型系统上取得805.9MTEPS的处理性能,相比单节点系统的性能加速比为4.89,具有较好的可扩展性。
其他文献
目前,软件开发领域的发展非常迅速,软件的规模也日益增大,各类应用软件的质量、性能要求也越来越严格。为了保证大规模软件的质量,人们提出了许多自动化的错误定位的方法,来
随着网络技术的发展,网络在人们的生活和社会的发展中起着越来越重要的作用,网络规模也随之越来越大。网络数据的可视化是理解和掌握网络结构形成与演化的重要手段,也是分析
目的:研究PINK1-Par-kin介导的线粒体自噬在阿霉素(Doxorubicin,DOX)致人心室肌细胞(AC16)线粒体损伤中的作用。方法:分别用不同浓度DOX处理AC16细胞24h。检测DOX对细胞存活
随着计算机视觉和多媒体技术的迅猛发展,数字图像的尺寸不断增大,传统的以像素为基元的图像分割算法越来越难以满足实时性的需求,而超像素分割算法的提出在一定程度上解决了
目前,仿真应用越来越向分布式、网络化发展。随着仿真应用规模的增长,系统中的节点数量、节点交互数据的规模和频率也迅速增加。网络作为仿真系统各个资源的连接器,其数据传
近年来,随着人工智能、虚拟现实等智能科技的迅速发展,基于视觉的手势识别因其简单、自然、直观和非侵犯性等特性已成为人机交互的重要组成部分和研究热点。手势分割作为手势
随着大数据时代的来临,互联网网络规模的日益扩大和承载业务种类的逐渐繁多,网络流量呈现惊人的快速增长。如何有效地对网络应用流量类型进行快速且准确的识别分类,成为一个
光纤陀螺惯性导航系统以高精度、低功耗、高可靠性的优势越来越多地被应用于空间卫星的姿态控制中,光纤陀螺应用在空间中其误差会受到辐射效应的影响,进而使光纤陀螺的性能发
近些年来,数字信息呈喷薄式地增长发展,逐渐被广泛地应用到科技发展的各个领域当中。数字彩色图像由于具有特殊的颜色、纹理和形状等特点,从而成为了多媒体数字信息中应用最
随着大数据与人工智能时代的到来,数据与智能在我们的生活与工作中扮演着举足轻重角色。数据挖掘作为大数据与人工智能应用最为广泛的一条技术分支,其中的数据挖掘算法的性能