面向万亿次量级嵌入式计算的体系结构关键技术研究

被引量 : 0次 | 上传用户:boluoxj
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着各种通信标准和编码算法的不断演进,高性能嵌入式应用对处理器的性能和能耗提出了越来越高的需求,万亿次量级嵌入式应用开始涌现,超大规模集成电路(VLSI)技术的飞速发展也为构建满足这种需求的高能效嵌入式处理器提供了可能。然而,将VLSI潜能变成满足万亿次量级嵌入式应用需求的实际计算能力仍然是一项极具挑战性的工作。传统的嵌入式处理器采用简单的处理器结构,可以获得很低的功耗,但是性能远不能满足未来嵌入式应用的需求。而以GPU、MIC为代表的高性能微处理器,采用众核结构在单个芯片上集成了数十亿支晶体管,虽然可以提供很高的性能,但是由于使用传统的超标量、同时多线程等技术,消耗了大量的功耗,远不能满足未来嵌入式应用的能耗需求。基于以上背景,作者选择了“面向万亿次量级嵌入式计算的体系结构关键技术研究”作为论文课题。本文深入研究了各种能耗有效的体系结构技术,研究内容涉及新型数据存储层次设计、全分布式VLIW的功能单元互连设计、超低功耗的处理器核设计、基于流模板的可重构计算等关键领域。本文的工作和创新体现在:1、提出了多级粒度匹配的数据存储层次(MGR:Multi-level Granularity-matchedRegister Hierarchy)设计。MGR将嵌入式应用的数据访问和处理过程层次化:最外层为粗粒度的流式数据访问,有很强的顺序性和可预知性;中间层为块数据访问模式,每次取一个块,可预知性强,块间相关性较弱;最内层是对块内数据的访问,较灵活,具有一定的随机性。针对这三个层次,MGR分别用帧缓冲存储器、高级寄存器文件和超小像素点寄存器文件去捕获不同层的数据局域性,使得每一级存储层次的设计都只需关注其本身功能的实现,这样每一层的硬件实现都简单高效。实验结果显示,相比于当前的其它典型存储层次,MGR可以获得53%~62%的能耗降低,同时性能保持不变或只有少许降低。2、提出了面向全分布式VLIW结构的功能单元部分互连设计。针对全分布式VLIW结构下功能单元全互连结构延迟大、功耗高、可扩展性差的问题,提出功能单元部分互连设计。首先分析了嵌入式应用对全互连结构的使用情况,总结出几种典型的通信模式;然后针对这些通信模式提出了多种部分互连结构,建立了部分互连结构的VLSI模型;最后深入分析了各种部分互连结构对延迟、面积、功耗和程序性能的影响。实验结果显示,相比于全互连结构,部分互连结构可以极大的降低硬件开销,而性能只有稍许的降低。同时,随着VLIW规模的扩大,部分互连将展现出更好的可扩展性。3、设计了一种超低功耗的嵌入式处理器核。由大量简单小核和少量复杂大核构成的大规模多核并行机制成为提高嵌入式处理器能效的主流趋势。针对简单小核,提出Smart Core处理器设计。Smart Core基于显式并行、精确计算的设计理念,采用了VLIW并行执行模式、多级数据存储层次(流式存储+层次化寄存器文件+超小寄存器文件)、非对称全分布式指令寄存器来分别降低指令流水线、数据供应、指令供应的能耗。初步的实验结果表明,Smart Core比传统嵌入式处理器提高能效25倍,在40nm工艺下,由Smart Core构建的众核系统可以获得单芯片1Tops以上的性能,同时保持操作能效比在100Gops/W以上。4、提出了基于流模板的多粒度动态可重构处理器(MGR-SAT: AMulti-Granularity Reconfigurable DSP based on Stream Architecture Template)设计。MGR-SAT结合了流处理技术、动态可重构技术和基于平台的技术,在硬件上由标量核、流处理核及相应外部接口组成。流处理核是一个动态可配置单元,由粗粒度可配置单元和细粒度可配置单元组成,用于计算加速。MGR-SAT整体上以流处理的方式运行,标量核负责配置流处理核,并启动流处理核的执行和数据传输。实验结果显示,MGR-SAT与当前典型的处理平台相比,有着明显的性能和功耗优势。
其他文献
被誉为“21世纪绿色工程材料”的镁合金以其低密度、高比刚度和优良的导热性等诸多优点越来越广泛地应用于航空航天、汽车、电子等领域。相较于传统的铸造镁合金,变形镁合金板
随着年龄的增加,老年人生活不能自理的发生率也会增加,即失能老人比例增加。2013年我国失能老人已达3750万人,对失能老人的照护主要有家庭照护、机构照护和社区居家照护三种模式
吐蕃赞普时期是藏族历史上一个重要的阶段,也是将散落在西藏的各小邦政权和部落联盟政权整合的一个重要阶段。吐蕃赞普统一了青藏高原各自为政的部落政权,创建官制,厘定法律等,藏
我国重大水利水电工程的坝高、泄量、泄洪功率均居世界领先水平。由于高速水流、水气二相流、水流——结构相互作用的复杂性,使得泄流结构在长期泄流荷载作用下极易发生疲劳或
目的:检测血清胱抑素C(Cys-C)、尿微量白蛋白(UmALB)、血清尿素氮(BUN)、肌酐(Scr),分析其对高尿酸血症患者早期诊断肾功能损伤的临床检测价值。方法:选择60例高尿酸血症患者和60例健康
机构照护作为养老照护服务体系的重要支撑,在养老照护服务体系中扮演着不可替代的角色。对于失能老人这一特殊群体,机构照护更是具有家庭照护和社区照护无法比拟的优势:一方面,因
现代计算机技术和机械工艺设计的不断进步推动了数控车床加工技术的发展,人们对其加工精度提出了更高的要求,数控车床是由数字化程序控制的自动实现对零件加工的高科技加工设
描述一种基于LNG能源优化利用的区域分布式能源系统,该系统可为大型居住社区或小型乡、镇提供生活必需的冷能、热能、电能、燃气等能源。随着LNG产量的增加,运输条件的成熟,
自2004年以来,经营性土地使用权的招拍挂出让机制在我国土地市场中的核心地位得以确立。但现实数据表明,在不同时期和不同地域,招标、拍卖和挂牌三种出让方式均得到不同程度的应
伴随我国市场经济发展速度的加快,国家开始越发重视三农问题,这使得我国农村经济在最近几年得到了一定发展,但相较于城市,农村经济依旧非常落后,在城乡二元体制存在差异的情