论文部分内容阅读
软件失效预测是软件可靠性评估过程中最耗时最困难的部分,失效预测过程中任何改进都可能极大降低软件成本。传统的软件失效预测方法一般是利用经典的参数模型,而参数模型针对复杂软件失效数据不仅无法正确的估计其预测模型,且错误率较高,效率低下。相反,非参数方法在软件失效预测过程中不依赖于经验假设与未知模型的估计,既可避免预测中模型不符、参数估计偏差等问题,又可以充分的利用软件失效数据的历史信息。基于非参数方法的软件失效预测首先针对软件失效数据的历史信息进行数据预处理,然后,利用对已有数据的整理进行软件失效预测建模,最后采用已有模型进行软件失效预测。本文在分析软件失效影响因素的基础上,以提高软件失效预测的精确度为目的,对一类传统的非参数模型进行了研究与改进。主要工作如下:首先,提出基于加权滑动窗口的单变量非参数软件失效预测方法(WSW-NM),对单变量的软件失效数据进行预测。采用滑动窗口作为输入,通过设置指数权函数增加近期数据对软件失效数的影响,对滑动窗口中各期数据进行加权处理并针对异常点进行动态调整,改变各期数据在预测中的重要程度。实验证明,该方法能够提高软件失效的预测精度。其次,提出基于主成分分析的多变量非参数软件失效预测方法(PCA-INW)。对原始数据进行主成分分析减少样本的输入因子数,利用主成分分析中的方差贡献率作为非参数方法中核函数窗宽矩阵的权重,消除了各输入因子对结果的作用程度不同所造成的影响。实验结果表明,维度的减少使模型的训练时间及预测时间都有所降低,在预测结果的精度和稳定性上得到了提高。然后,提出基于非参数因果关系检验的多变量软件失效预测方法(PCA-INW-Granger),针对已有的Granger因果关系检验方法只适用于两个变量以及需要诸多限制条件的问题,提出了一种基于改进的非参数估计法(PCA-INW)的多变量因果关系检验方法。该方法运用PCA-INW方法,借鉴Granger因果关系的思想从复杂系统建模角度研究变量间的关系,适用于检验多维变量间的因果关系,其优点在于对于多输入单输出(结果)的多维系统,不需诸多限制条件,可以检验多变量之间在非线性意义上的因果关系。最后,为了验证所提出方法的有效性,本文采用多组标准数据集作为研究对象,分别对以上三个模型与经典模型进行实验性能对比,结果表明,本文所提出的非参数方法较之前的传统方法具有更好的适应性,其预测的精度和稳定性都有显著提高。