针对CPU-FPGA异构多核片上系统的自动化数据布局研究

来源 :山东大学 | 被引量 : 0次 | 上传用户:shahua001
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着深度学习与大数据应用的兴起,传统的基于CPU的架构已经难以满足这些新型应用的计算要求。对此,工业界与学术界开始使用硬件加速器来弥补传统CPU架构的弊端。FPGA凭借其高能效比以及灵活的动态可重构功能(dynamic reconfiguration)得到了越来越多的关注。然而,传统的基于FPGA的设计往往需要花费大量的时间并且调试难度很大。随着FPGA的不断发展,高级综合(High Level Synthesis,HLS)工具得到了极其广泛的应用,其有效地解决了FPGA设计难于实现的问题。高级综合工具将C\C++等高级语言自动转换为相对应的硬件描述语言模块,大大减少了设计实现基于FPGA的系统应用的难度,特别是针对大量的软件工程师而言。同时,高级综合工具提供了许多优化技术以便于系统设计者针对包括硬件资源消耗,性能,功耗等在内的不同优化目标进行系统优化。此外,不同于以往基于CPU的系统架构,异构系统中的存储子系统通常要复杂的多。具体而言,纯CPU系统架构下的存储体系一般由多级Cache与主存构成。而针对异构系统来说,有着软件可控的便笺式存储器(Scratchpad Memory,SPM)以及CPU端与加速器端均可访问的共享Cache。这些存储体系各具特点,对其进行合理地利用对提高整个系统性能有着重要的作用。针对CPU-FPGA异构多核片上系统.(Heterogeneous Multiprocessor system-on-chip,HMPSoC)而言,片上存储资源极其有限。因此,对其进行合理地利用尤为重要。然而当今最先进的高级综合工具都依赖于系统设计者人工决定复杂存储体系下的数据布局。在这篇论文中,我们提出了一个可以与商业化工具Vivado HLS无缝结合的自动化的数据布局框架。首先,我们基于Zedboard异构多核片上系统设计了一系列微测试程序来测量各种类型的访存延迟,如Cache命中,Cache miss,或者直接访问主存等。基于对上述存储子系统模型中数据的分析,我们得出了一些不同于传统CPU架构环境的结论:如Cache所发挥的作用没有传统环境下的那么大;针对突发模式访存来说,其访存延迟与存储资源的选择基本没有关系。因此基于这些结论,我们发现基于频率与局部性的,针对传统的CPU架构的数据布局策略直接应用于CPU-FPGA异构多核片上系统上所取得的性能并不理想。依赖于我们的存储延迟分析模型并结合LLVM编译框架,我们提出了一个基于整数线性规划(Integer linear programming,ILP)的自动化数据布局框架来决定了每一个数组对象应该经由以下哪种存储被访问:片上块存储(Block RAM,BRAM),CPU-FPGA共享的第二级存储(Level 2 Cache,L2 Cache)或者直接访问双倍速率(Double Date Rate,DDR)存储器。此外,我们设计了一个基于贪心策略的基准算法来进行比较,在Zedboard平台上得到的实验结果表明相较于基准算法,我们所提出的策略有1.39X的性能加速比。
其他文献
在认罪认罚从宽制度下,检察机关的量刑建议是对法庭量刑具有预决效力的实体性权力。检察机关提出公正、精准的量刑建议,是确保认罪认罚从宽制度良好运行的关键所在。然而在实
<正>(根据录音整理,未经本人审阅)主要内容:TRS作为专业提供废旧轮胎回收利用解决方案的瑞士公司,结合中国再生橡胶和橡胶粉市场的发展情况,为了推出面向中国轮胎市场的再生
目的探讨持续负压吸引和无负压持续吸引对胃癌根治术后患者胃肠功能恢复的影响。方法将82例行胃癌根治术后的患者按抽签法分为研究组和对照组,每组41例。研究组给予无负压持
中药是中华民族的瑰宝,近年来以绿色天然、毒副作用小等特点备受世界各国人民的推崇。然而,由于我国知识产权制度建立较晚,对知识产权战略的研究和应用均处于起步阶段,使得现有的
报纸
核心提示:上世纪八九十年代,莆田油画产业由在外莆籍画家带动,迅速成为当地优势产业。然而,由于产业配套、地域等因素,莆田油画业近年来渐渐落后于厦门、深圳等地。$$    危
报纸
目的评价使用手法点压第二颈椎横突治疗偏头痛的临床效果。方法将48例偏头痛患者随机分两组,治疗组28例,采用手法点压第二颈椎横突的方法,对照组20例,采用口服去痛片治疗。结
随着高性能计算系统计算能力不断提升,其体系结构和软件系统的复杂性和规模也不断增加,这对各种大规模并行应用的设计和优化带来极大的挑战,因此面向高性能系统的大规模并行应用性能建模的研究越来越重要。准确地预测大规模并行程序的性能,不仅能够为用户分析程序性能,使其能在高性能计算系统上高效地执行应用程序,还能帮助用户管理和调度作业,合理地分配调度策略,减少作业等待时间,并且能够进行资源评估,指导用户申请资源
企业内部控制信息披露是关系着经济发展和金融安全的重要问题。本文在内部控制信息披露相关的概念和理论的基础上,对于我国公司内控信息披露现状进行分析,分析其内部控制信息
缺锰可以引起多种疾病,但体内锰含量过高也不利于健康,如含量过高会发生锰中毒。还会损害中枢神经。锰在人体组织中总量只有12~20毫克,人体对锰需要量并非很高,成人每天5毫克就足
1材料与方法1.1调查对象阿拉善盟卫生系统医疗机构及各级疾控共14家单位,其中3家疾控中心,1家二甲级综合医院,1家二甲级专科医院,1家二甲级蒙医院,2家二级一等医院,5家一级医