论文部分内容阅读
由于大规模数据分析和处理需求影响,对多处理机系统的规模和处理能力及稳定性提出了更高的要求。随着多处理机系统规模的增大及处理速度的增加,系统中出现故障节点就在所难免。为了维持系统的可靠性,系统应具有识别故障节点的能力。在系统的故障诊断方面主要有两种诊断方法:系统级诊断及电路级诊断。由于电路级诊断涉及到更多的硬件操作,所以在多处理器的故障诊断中人们更多的倾向于系统级诊断,让系统自身独立完成检测与诊断工作。在系统级诊断中,有许多诊断的策略,可归类为精确诊断策略和非精确诊断策略。非精确诊断策略的优点在于它比精确诊断策略有更大的诊断度,也就是系统能达到的故障诊断的范围。但非精确诊断的研究起步较晚,可借鉴东西不多,有一定难度,自然更具有研究意义和研究空间。多处理机系统往往可以用规则互连网络来模拟,其中最典型的就是超立方体网络及其变种,星型网络,Mesh网络等。虽然这些网络的精确诊断方面的研究已取得了较大的成果,但在非精确诊断方面的研究成果还较少,还有许多值得探讨的地方。本文通过分析这些新型规则网络的拓朴结构,研究他们的非精确诊断策略,为网络的故障诊断提供理论基础,更好地服务于高性能的超级计算机系统。
本文主要以类超立方体网络、交换超立方网络以及星型网络为研究对象,研究他们的几种非精确诊断的诊断度及诊断算法。主要工作及创新之处如下:
1、通过对交换超立方网络EH(s, p)(s≤p)的网络结构特性进行分析,提出并证明了交换超立方网络EH(s, p)(s≤p)是((k+1)(s+1)-(k+1)(k+2)/2+1)/k-可诊断的,基于这一重要结论提出一个交换超立方网络EH(s, p)(s≤p)的t/k故障诊断算法,利用这一算法,能有效地确定一个包含所有故障处理器节点集合,并且能确保该集合最多有k个处理器是误诊的。结果表明,交换超立方的t/k诊断度大于其传统诊断度s+1。
2、对于k∈[0,n-]提出了一个关于类超立方体网络(包括超立方体,交叉立方体,梅氏立方体,局部扭立方体,扭立方体等)t/k-诊断算法。该算法能正确地在网络中识别所有的故障节点,且最多只有k个节点可能被误诊。其时间复杂为O(N)N=2n。
3、证明了n维BC网络在删除(2n?2)个节点后存在一个基数至少是2n?2的连通分支,基于这一结论,提出一个BC网络t/t故障诊断算法。通过该算法,能诊断出BC网络中所有的故障节点,除了最多一个节点是误诊外。该算法的时间复杂性为O(N)N=2n。
4、提出一个称之为强局部诊断的概念,给出了关于节点强局部可诊断的一些重要结果。利用这些结果,我们获得了n-维超立方体网络Qn关于单个节点的强局部诊断度等于它的度数的结论。进一步,当失效边数量不超过(n-3)不完全Qn关于单个节点的强局部诊断度仍等于该节点的剩余度。最后,我们获得如下结论:当不完全最小度大于3时,即使失效边的数量达到(7(n-3)-1)它关于单个节点的强局部诊断度仍等于该节点的剩余度。
5、提出了t/(t+1)-可诊断系统的概念,提出了刻画t/(t+1)-可诊断系统特征的充分必要条件。提出了t/(t+1)-断度的若干重要性质。利用这些性质提出并证明了Qn和Sn都是(3n?5)/(3n?4)-可诊断的,2D-Mesh和3D-Mesh网络分别是8/9和11/12-可诊断的。
6、本文借助于条件诊断度的思想,我们引进了2好邻居可诊断系统的概念。我们提出并证明了n-维扩展超立方体网络是2好邻居邻居(8n?2)-诊断的,并证明它不是2好邻居(8n-2)-诊断的。
这些研究成果不仅丰富了网络故障诊断理论的内容,而且也为实际网络的故障诊断软件设计提供了重要的基础和新的方法。
本文主要以类超立方体网络、交换超立方网络以及星型网络为研究对象,研究他们的几种非精确诊断的诊断度及诊断算法。主要工作及创新之处如下:
1、通过对交换超立方网络EH(s, p)(s≤p)的网络结构特性进行分析,提出并证明了交换超立方网络EH(s, p)(s≤p)是((k+1)(s+1)-(k+1)(k+2)/2+1)/k-可诊断的,基于这一重要结论提出一个交换超立方网络EH(s, p)(s≤p)的t/k故障诊断算法,利用这一算法,能有效地确定一个包含所有故障处理器节点集合,并且能确保该集合最多有k个处理器是误诊的。结果表明,交换超立方的t/k诊断度大于其传统诊断度s+1。
2、对于k∈[0,n-]提出了一个关于类超立方体网络(包括超立方体,交叉立方体,梅氏立方体,局部扭立方体,扭立方体等)t/k-诊断算法。该算法能正确地在网络中识别所有的故障节点,且最多只有k个节点可能被误诊。其时间复杂为O(N)N=2n。
3、证明了n维BC网络在删除(2n?2)个节点后存在一个基数至少是2n?2的连通分支,基于这一结论,提出一个BC网络t/t故障诊断算法。通过该算法,能诊断出BC网络中所有的故障节点,除了最多一个节点是误诊外。该算法的时间复杂性为O(N)N=2n。
4、提出一个称之为强局部诊断的概念,给出了关于节点强局部可诊断的一些重要结果。利用这些结果,我们获得了n-维超立方体网络Qn关于单个节点的强局部诊断度等于它的度数的结论。进一步,当失效边数量不超过(n-3)不完全Qn关于单个节点的强局部诊断度仍等于该节点的剩余度。最后,我们获得如下结论:当不完全最小度大于3时,即使失效边的数量达到(7(n-3)-1)它关于单个节点的强局部诊断度仍等于该节点的剩余度。
5、提出了t/(t+1)-可诊断系统的概念,提出了刻画t/(t+1)-可诊断系统特征的充分必要条件。提出了t/(t+1)-断度的若干重要性质。利用这些性质提出并证明了Qn和Sn都是(3n?5)/(3n?4)-可诊断的,2D-Mesh和3D-Mesh网络分别是8/9和11/12-可诊断的。
6、本文借助于条件诊断度的思想,我们引进了2好邻居可诊断系统的概念。我们提出并证明了n-维扩展超立方体网络是2好邻居邻居(8n?2)-诊断的,并证明它不是2好邻居(8n-2)-诊断的。
这些研究成果不仅丰富了网络故障诊断理论的内容,而且也为实际网络的故障诊断软件设计提供了重要的基础和新的方法。