论文部分内容阅读
统计诊断方法出现于上个世纪70年代,是统计推断的一个重要分支。顾名思义,统计诊断就是对统计分析进行诊断,即对数据、模型及相关的统计方法进行分析,并借助诊断统计量来找出其中可能存在的问题。进而解决问题,使得统计推断能更好的反映真实情况,更准确的揭露研究对象的客观规律。目前的统计诊断方法大都是基于均值回归模型的,一般要求观测数据的方差齐性。但在实际应用中,经常会遇到一些带有异方差的数据。如果不能消除异方差的影响,仍然使用这种均值回归模型处理异方差数据,就不太合适,难以得到较好的结果,因此就有必要对方差参数进行建模。针对这种情况,本文基于正态分布,同时对均值参数和方差参数建立回归模型,详细的研究了联合均值与方差模型的统计诊断。主要研究内容如下:(1)在极大似然估计理论下,通过似然距离和Cook距离来研究了联合均值与方差模型的数据删除方法统计诊断;同时,基于似然距离的局部影响分析方法,分别通过均值漂移扰动和方差加权扰动进行了影响分析。(2)在贝叶斯理论的框架下,首次提出了联合均值与方差模型的Bayes统计诊断。通过Gibbs抽样和MH算法分别得到均值模型和方差模型的参数估计值。基于数据删除方法,研究了四种Bayes诊断统计量:K-L距离、L1距离、χ2(chi-square)距离和Cook后验均值距离。(3)常见的数据删除方法是删除某一个样本点或一些样本点,度量对既定模型参数估计的影响,而Pena距离研究删除样本中的各个点对某一既定样本点的回归值和预测值的影响,也是基于数据删除的诊断方法,是对诊断统计量的重要补充。本文将Pena距离应用到联合模型中,研究了联合模型的Pena距离的诊断效果,同时与文中前两部分的研究结果进行比较。用Monte Carlo方法对上述三部分研究内容进行模拟分析,我们设置的几个异常点均被诊断出来。同时,用两个实例数据分析了上述诊断方法,与相关参考文献中的诊断结果进行比较。说明了本文所提出的方法是行之有效的。