论文部分内容阅读
星载交换机是空天信息网络的重要组成部分,用于不同链路数据之间的实时交换。与地面交换设备不同,星载交换机工作在辐射严重的空间电磁环境中,高能粒子的干扰很容易使星载交换机的关键器件FPGA发生单粒子效应,从而产生后果严重的功能错误。对星载交换机的容错方法进行研究,消除单粒子效应对交换机的影响,确保其长时间高可靠的运行,具有重要的理论与实际意义。此外星载设备的研制成本和发射费用都很高,需要在设计之初就对其可靠性有较好的把握,所以建立健全容错系统的可靠性评估机制,也是设计高可靠星载交换机需要解决的问题。针对这些问题,本文采用了层次化的设计思想,分别从系统级和器件级两个层面进行星载交换机容错方法的研究与设计。系统级设计主要是通过冗余来提高系统整体的可靠性。在现有交换机原理样机的基础上,设计了星载交换机的体系结构,与原理样机相比,星载交换机采用了双机冗余结构并增加了系统监控板,该板卡用于检测系统各板卡的工作状态。文中对系统的状态检测机制和故障切换机制进行了设计与改进,在改进后网络状态监测方法中,状态信息的读取和数据包的收发不再使用同一数据总线,为数据信息节省了带宽。在器件级,设计了针对SRAM型FPGA的检错—诊断—重构三模冗余(DDRTMR)容错系统,该系统是在重构三模冗余系统的基础上增加了一个具有自检功能的错误诊断电路。与重构三模冗余方法相比,该方法不仅能够检测冗余模块中的错误,还能检测表决器以及错误诊断电路中比较器的错误,从而防止表决器单点故障造成的系统失效。该系统采用连续检测错误位置的方法对错误的类型进行诊断,并根据错误类型的不同选择相应的重构操作。最后使用马尔科夫模型对所设计的DDRTMR容错系统进行了可靠性分析,仿真结果表明该系统的平均无故障时间相比重构三模冗余系统增加了近4倍。为了验证整个星载交换机系统的可靠性能,建立了整个系统的并—串联混合可靠性模型:具有同一功能且互为备份的两个板卡构成并联模型;系统中的各主要模块构成串联模型。论文分析推导了整个交换机系统的可靠度公式,仿真计算结果表明所设计的容错方法能够使整个系统达到5个9的可靠度指标。论文从系统级和器件级两个层面对星载交换机的容错机制进行研究与设计,并对所设计系统的可靠性进行了验证,对于设计高可靠星载交换机的工程实践具有一定的指导与借鉴意义。