论文部分内容阅读
随着并行计算系统中处理器数目的快速增加,系统中出现故障处理器的可能性也在急剧增大,这极大地降低了系统的可靠性。为了保证系统能够正常工作,就必须准确、及时地定位故障。系统级故障诊断是自动定位并行计算机中故障处理器的一条行之有效的途径,其基本思想,是让处理器相互测试,通过对测试结果的分析定位故障。与传统的电网络相比,光网络具有极高的带宽、极低的功耗、极低的时延等优秀性质,被公认为下一代主流互连网络。可以用图来表示光网络的拓扑结构,其每个顶点表示由一个处理器、其局部存储器以及相关的光路由器组成的集合,如果在两个光路由器之间能够建立一条直接光路,就用一条边将两个对应的顶点连接起来。容错性与诊断能力是衡量互连网络性能的极为重要的指标。本文的主要目的,是借鉴传统的容错性研究方法,研究几类典型光互连网络的容错性与诊断性,具体研究成果如下:(1)多网格超立方体是一类重要的光互连拓扑,在兼备超立方体和网格的优良性质的同时,它还规避了超立方体可扩性较差以及网格直径较大的弱点。本文研究了多网格超立方体的诊断性。首先,在比较模型下确定了多网格超立方体的诊断度、强诊断度和条件诊断度,证明条件诊断度大致是诊断度和强诊断度的三倍。其次,在PMC模型下确定了多网格超立方体的诊断度、强诊断度和条件诊断度,证明条件诊断度大约是其诊断度和强诊断度的四倍。由此可见,通过忽略某些小概率事件,可以显著地提升多网格超立方体的自我诊断能力。(2)超网格是又一类重要的光互连拓扑。据报道,超网格特别适用于片上多机系统。本文首先研究了超网格的容错性,然后在PMC模型下确定了超网格的g-邻居条件诊断度。与传统诊断和条件诊断相比,这种诊断方式显著提高了光互连网络的诊断能力。(3)本文根据光通信的特点,定义了一种新的光网络通信模式,引入了r-直径和r-连通度的概念,它是传统直径和传统连通度概念的推广。在此基础上,求得了超立方体的r-直径和r-连通度。与传统超立方体电互连网络相比,引入的这种增强通信模式能显著地减小网络通信延迟,提高网络容错能力。(4)最后,对本文工作进行了总结,并对后续研究工作进行了展望。上述研究成果充分表明,与电网络相比,光网络不仅具有技术上的优势,而且具有更好的容错性与更强的诊断能力,因而具有极为广阔的应用前景。