【摘 要】
:
随着工艺特征尺寸逐渐趋近于纳米级,SRAM型FPGA越来越容易受到软错误的影响而引发系统故障.检查点是进行故障恢复的有效技术,可以将故障系统恢复至之前的正常状态.由于检查点
【机 构】
:
计算机体系结构国家重点实验室中国科学院计算技术研究所北京100190;中国科学院大学北京100190计算机体系结构国家重点实验室中国科学院计算技术研究所北京100190北京控制工程研究所北京10019
【出 处】
:
第十五届全国容错计算学术会议(CFTC'13)
论文部分内容阅读
随着工艺特征尺寸逐渐趋近于纳米级,SRAM型FPGA越来越容易受到软错误的影响而引发系统故障.检查点是进行故障恢复的有效技术,可以将故障系统恢复至之前的正常状态.由于检查点保存和恢复过程中需要暂停系统功能,系统平均恢复时间(mean time to repair,MTTR)对系统性能至关重要.HHC(Hierarchical Hardware Checkpoint)层次化的硬件检查点技术包含高速片上检查点和低速片外检查点,能够对单粒子效应(single event effect,SEE)引起的绝大多数故障采用片内检查点进行恢复,因此可显著降低MTTR.同时,由于HHC仅需在片上保存与用户设计有关的逻辑状态的比特位,而对配置比特位使用ECC进行保护,因此片内存储资源的占用很少.实验数据显示,相对于传统的片外检查点技术,HHC技术可以使MTTR降低94.30%,存储资源占用仅为FPGA的11.11%,可以进一步优化到6%.
其他文献
本文提出了一种新的扩展IBM OmniFind Enterprise Edition搜索引擎的语意搜索和结果分类的方法,该方法利用IBM OmniFind Enterprise Edition,并结合IBM开源非结构化信息管理
嵌入式软件功耗已成为嵌入式系统设计的重要瓶颈,而物联网的兴起,使得嵌入式软件在以太网卡部分的功耗所占比重越来越大.文章首先简单介绍了HMSim,然后提出了一种基于HMSim
电力系统频率是电力系统的重要状态反馈量,为保障电力系统安全稳定运行,需加以动态控制。随着科学技术的不断发展,频率的测量的精度和技术速度在不断的提高,但由于电力系统负
软件定义网络通过分离网络控制平面与数据转发平面,利用对底层网络硬件的抽象和虚拟化,逻辑上实现对网络的集中式可编程控制,从而提高网络的开放性、灵活性、可扩展性和可管
命名数据网络是为改善当前互联网在拥塞控制、移动性、安全性等方面的不适应性而提出的一种新型网络.网络关注的核心是消息的内容,消息在网络中基于名字路由,不携带消息的源
网络地址转换(Network Address Translation,NAT)和虚拟专用网(Virtual Private Network,VPN)分别用以缓解IP地址耗尽和建立安全通信,但NAT协议和支撑VPN的IPSec协议协同使用
当前Hadoop的实现主要针对同构集群,假设任务处理的数据基本是本地的。然而,实际应用中硬件配置的差异、资源虚拟化等都将导致节点的异构。这就暴露出现有的数据分配策略对数
在半导体工业中使用过硅通孔的3D集成电路是一项新型的技术.过硅通孔是克服规模限制的一种有效的技术,可靠性低以及成品率低是这项新兴技术主要的挑战.过硅通孔在制作过程中
基于MATLAB平台的半物理仿真技术的研究在工程领域应用越来越广泛,成为世界各国研究的热点,在搭建半物理仿真系统形成闭环测试时,目标机与主机之间的信号交互对于整个仿真系
随着FPGA集成度和微电子工艺的提升,其系统的复杂性必然导致电路中存在各种故障的隐患,因此,为了保证整个芯片的可靠性和安全性,对FPGA的测试尤为重要.目前,测试成为影响FPGA