论文部分内容阅读
上个世纪末到这个世纪初,蓬勃发展的分布构件技术为分布应用提供了基础设施的无缝集成、代码的二进制复用和应用的快速开发能力。构件化分布应用开发复杂度降低的同时,它的调试和诊断依然困难。快速诊断和定位分布构件系统故障,对减少系统的平均恢复时间、增强分布构件系统的高可靠性和高可用性具有重要的意义。 论文主要研究构件化应用服务器平台的诊断支持问题。分布构件系统的故障诊断不仅和硬件系统的故障诊断存在共性问题,而且分布构件系统的故障诊断有着其特殊性,这些特殊性对现有的诊断方法提出了更高的要求。它主要表现在分布构件系统是一个软件系统,具有比硬件系统更复杂的逻辑结构;分布构件系统是一个时序系统,有着比硬件系统更强的时序特性;另外,分布构件系统的故障类型较多,需要为不同种类的故障建立相应的诊断模型。文章首先分析了现有的分布构件故障诊断系统和常用的故障诊断方法,对诊断的形式化模型进行了概念上的分类和比较。针对分布构件系统的复杂性,对基于模型的诊断算法进行了研究和改进,提出了求解极小超定子系统算法、冲突识别算法和求解极小诊断等一系列算法,提高了诊断的效率。研究了分布构件语义故障诊断中的时序问题,建立了具有时序特性的诊断模型,为构件内存访问故障提出了基于贝叶斯理论的BMMD方法,给出了特征选取的标准。最后在StarCCM平台上研究了组装件语义诊断和构件内存访问失效故障诊断的实现机制,增强了StarCCM平台的易用性。 主要研究内容包括: 1.分析了分布构件故障诊断面临的挑战,将分布构件系统故障诊断的研究定位在为分布构件应用提供诊断支持上。在分析了现有故障诊断方法和分布构件诊断系统之后,按照诊断时使用的系统信息和观察结果将现有的诊断方法分类为三种概念模型,它们分别是偏离正常行为的诊断(DNB)、匹配异常的诊断(MAB)和异常分类的诊断(AC),同时对这三种概念模型使用的知识类型、形式化方法和推理方法进行了比较。基于三种不同的概念模型,分别分析了基于一致性的诊断、反绎诊断和假设演绎诊断形式化模型,并在此基础上,确定分布构件故障诊断研究的具体目标。 2.为提高诊断方法的效率,提出了求解极小超定子系统的算法SAMODS,该算法充分利用诊断时可能遇到的冗余信息,“静态”计算极小超定子系统,简化了实际诊断时的计算量。在SAMODS算法基础上,进一步提出了冲突识别算法MODSBCI。本文还提出了由极小冲突求解极小诊断的算法GSA,GSA将极小诊断的求解问题映射到0/1整数规划问题,建立了模拟退火和遗传算法相结合的快速求解算法。基于分而治之的思想,提出了用于缩小问题求解规模的分解算法OONA,该算法能够很好地将复杂问题分解为多个规模较小的子问题。 3.语义故障和内存访问失效故障是分布构件环境下最常见的故障类型,它们一直是分布构件故障诊断的重点和难点。文章针对分布构件系统语义诊断中的时序问题研究了时间本体的各个要素,提出了适合分布构件系统故障诊断的时序框架MLTF,在MLTF的基础上,根据QA-network的概念,提出了分布构件系统语义故障诊断的模型。针对分布构