大规模高通量计算系统的可靠性设计研究年度报告

来源 :科技创新导报 | 被引量 : 0次 | 上传用户:liqianben
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
高通量计算系统由海量的计算节点、存储节点通过网络互连而成。由于规模巨大,系统的可靠性成为一个非常严重的问题,部件失效已经成为一种常态,系统设计必须考虑容错的问题。我们需要建立新的高通量计算系统的可靠性保障框架,来适应高通量计算中不同层次的可靠性需求,研究从芯片级到系统级跨层次的可靠计算技术。围绕该目标,该研究从高通量处理芯片的故障检测和容错设计方法,高通量计算系统的失效检测和恢复方法和从芯片级到系统级的故障自预测、自检测、自定位、自隔离和自愈合(5S)支撑环境3方面展开研究。截至2013年各项工作按照任务
其他文献
申请公布号:CN105563409A  申请号:2014105267288  申请人:重庆能凯科技有限公司  地址:402233重庆市江津区几江滨江西段29#荣华光彩大厦B栋541号  发明人:周世平  Int.Cl.:B25B27/00(2006.01)I  摘 要:该发明涉及一种用于深水处设备的装卸工具,属于装卸设备技术领域,其包括竖直设置的套管,套管内穿有导杆,在导杆上半部分上设置有螺纹,在
学校日常性管理工作在学生的成长成才过程中起到一种潜移默化的作用,辅导员作为学生日常性管理工作的主要实施者,发挥着政治上引导、思想上教育、行政上管理以及心理健康知识传
目的研究讨论在对抑郁症患者使用心理护理干预后的具体效果。方法选择在我院接受治疗的76名患者,将其分为对照组与观察组。对照组采用常规护理,观察组在对照组的基础上采用心