论文部分内容阅读
空间基础设施的建设对国民经济和国家安全起到的作用是至关重要的。因此,对以不同种类卫星组网为核心的空间基础设施建设的研究方兴未艾。卫星综合信息网作为空间基础设施的具体实现形式,对其要求是可以长期、稳定的不间断运行,因此能够及时发现影响网络正常运行的故障,并实施有效处理是很重要的。由于卫星网络所具有的高成本和不可人工现场维修的特性,这就对卫星网络的容错能力提出很高的要求。尤其卫星综合信息网在面向民用的同时还要面向军事应用,这种对容错能力的需求就更为突出。卫星综合信息网的容错能力具体体现在对故障的检测、诊断和自修复能力上。从网络管理的角度来看,故障的检测、诊断和自修复就是故障管理所研究的内容。
相对于地面网络,卫星综合信息网的故障管理无论从管理的层次,还是从技术运用的深度和广度上,都要更复杂。卫星网络独有的网络节点和运行特性使传统的基于地面网络的故障管理远远无法满足其要求,因此研究面向卫星网络的故障管理成为网络管理领域新的课题,本文的工作就是对卫星网络故障管理这一新的技术领域进行研究。
论文首先从卫星网络自身的发展、网络管理以及容错技术三个不同的角度阐述了卫星网络故障管理的研究现状。通过引入管理粒度的概念,将卫星综合信息网天基部分的故障管理对象划分到不同的问题解决领域中,形成了网络级、功能级、设备级和组件级四种故障管理粒度。在对几种网络管理模式的性能指标的进行分析的基础上,结合卫星网络管理中星簇的概念,提出了一种适合于卫星网络特点的基于星簇的分布层次式故障管理体系结构。并对故障管理体系结构的组织形式、构建过程以及故障管理流程进行说明。
在对卫星综合信息网故障检测的研究中,论文对故障检测中天基和地基所遵循的网络管理协议分别进行了讨论,针对天基部分,在分析了当前几种主流的管理协议基础上,重点对面向卫星网络管理的MNMP协议进行了剖析;并遵循MNMP的对象定义规范DMMO,对卫星故障管理所涉及到的不同粒度的对象进行规范定义,形成了比较完备的故障管理信息库。为了对包括天基和地基在内的卫星综合信息网实现全面的检测,还对兼顾多种协议的检测形式进行了深入的研究,并根据研究结论,设计了一个完备的检测框架,该框架面向地基的部分采用基于通用信息模型CIM的协议转换网关来兼容各类协议;面向天基的部分通过MNMP协议实体之间的操作完成检测工作。为了考察基于MNMP故障检测的性能,对MNMP三种数据获取方式进行了实际的性能测试,并与SNMPv1和SNMPv2作了性能上的比较。针对卫星网络的故障传播模式,提出了一种应用包含和拓扑依赖关系的基于滑动时间窗口的事件关联数据处理技术。
在对卫星综合信息网故障诊断的研究中,针对卫星网络不同的粒度对象,建立了一个基于分层因果的故障诊断模型;将节约覆盖集诊断理论应用到卫星网络故障诊断模型的层内诊断中,并根据故障诊断组织形式来使用不同的节约原则;针对层间测试,采用了基于故障树最小割集的测试技术来完成测试序列的生成;设计了一种通用规则形式表示分层因果故障诊断模型中的因果关系,该规则形式可以表达多种不确定性知识。
在对面向网络管理的卫星综合信息网自修复技术的研究中,提出了采用重构容错机制来提高天基网管系统自身可靠性的思想。因为卫星网络管理系统自身的高可靠性是顺利完成网络管理任务的前提因素,因此有必要为卫星网络管理中的关键节点——簇首提供一种失效重构机制,以保证簇首的失效不会影响到网络管理任务的完成。通过对管理星簇重构容错机制的讨论,建立了以簇首选举为核心的网络级自修复问题解决模型,将簇首选举归结为分布式系统的选举问题,在对现有分布式选举算法的分析基础上,针对卫星网络和管理星簇的特点与需求,提出了一种具有容错能力的两段式簇首选举算法,并给出了算法的流程、形式化描述、算法证明以及复杂度分析,通过和其它分布式选举算法比较,说明了该算法的优势。此外还对选举算法实现时需要的参数、触发选举的算法进行了说明,并介绍了一种通用的分布式代理结构。
在理论研究成果基础上,开发了一套卫星综合信息网故障管理演示验证系统。
论文的研究依托于国家863重点项目,已通过阶段验收,所做工作得到了863专家组的肯定。通过论文的研究工作,为卫星综合信息网的故障管理提供了先进技术和方法,对加快我国的空间基础设施的建设起到推进作用。下一步工作将进一步丰富卫星网络故障诊断知识库的内容,并基于HLA仿真技术体制构建分布式仿真环境。