论文部分内容阅读
针对研究数据建立恰当的统计模型是统计分析的关键.经典的回归模型最初是基于正态假定而建立的.但是这种正态假定很可能与实际数据的分布规律并不吻合,导致分布误判下的统计分析结果出现偏差.而且,正态模型的参数估计并不稳健,数据异常点对统计分析结果影响较大.因此,寻求更加合理的分布模型,从而获得更为稳健的统计分析结果十分重要.而基于对称分布族进行统计建模是解决此类问题的重要途径之一.对称分布族包含正态、t、Logistic、slash、Powerexponential、污染正态等若干轻尾或重尾分布,是正态分布在对称意义上的推广.相比正态回归模型,对称分布模型具有稳健性、灵活性、可适性等诸多优势.因此,基于对称分布模型的统计分析具有十分重要的理论和实际意义.本文系统地研究了对称分布模型的各种统计问题,包括模型构建、参数估计及其稳健性探讨,以及基于对称分布模型的各种统计诊断问题,包括异方差检验、相关性检验、影响分析等.
第二章在对称分布下研究了具有AR(1)和ARIMA(0,1,0)相关性结构的回归模型的参数估计以及统计诊断问题.首先得到了基于Fisher-score迭代法的参数极大似然估计.然后研究了模型相关性、异方差的单个和联合检验,获得了score检验统计量,及其正交调整形式,并推导了检验统计量的极限分布和局部备择下的局部渐近功效.另外,得到了两类相关性模型在各种扰动模式下的局部影响曲率.最后通过随机模拟和实例分析验证了诊断方法的有效性和重尾对称分布模型的稳健性.
第三章将椭球分布应用于带有相关性结构的纵向数据模型,系统研究了几类椭球纵向数据模型的参数估计及统计诊断问题.对于椭球非线性纵向数据模型,建立了参数极大似然估计的迭代算法,给出了模型相关性、异方差的单个和联合检验的score统计量,以及对应正交调整形式,同时得到了统计量的渐近分布和局部渐近功效.对于椭球一致相关纵向数据模型,给出了参数的极大似然估计方法,并推导了一致相关存在性和一致相关系数齐性检验的score统计量及其渐近分布.对于椭球自相关线性混合效应模型,给出了参数极大似然估计算法,推导了自相关存在性和自相关系数齐性的score检验统计量及其渐近分布,并研究了几类扰动模式下的局部影响诊断.随机模拟和实例分析的结果表明所建估计及诊断方法是有效的,也突出了重尾椭球纵向数据模型的稳健性优势.
第四章在椭球分布下研究了结构型重复测量的测量误差模型以及异方差测量误差模型的参数估计问题.对于重复测量的椭球测量误差模型,基于正态尺度混合分布的分层表示,建立了参数的极大似然估计EM算法,并导出了参数的期望信息阵的闭合形式.对于椭球异方差测量误差模型,利用SMN分布的分层表示,分别建立了含方程误差和无方差误差下模型的两种不同分解结构,并据此给出了含方程误差和无方程误差下模型参数的不同的EM估计算法.随机模拟和实例分析的结果体现了所建估计方法的有效性,并且突出了重尾椭球分布测量误差模型的稳健性.
第五章在偏斜对称分布下研究了具有AR(1)相关结构误差的非线性回归模型的统计诊断.首先基于偏斜正态尺度混合分布建立了模型的分解结构,并据此得到了基于ECM算法的参数极大似然估计,以及模型的观察信息阵.然后给出了模型自相关存在性、以及含相关性和无相关性两种情形下的尺度参数齐性的score检验统计量,并给出了统计量对应的极限分布.同时,也给出了各种扰动模式下基于Q函数的局部影响曲率.最后通过随机模拟和实例分析说明了诊断方法的有效性和重尾偏斜对称分布回归模型的稳健性.
综上所述,本文比较深入系统地研究了对称相关性回归模型、椭球相关性纵向数据模型、重复测量的椭球测量误差模型、异方差椭球测量误差模型以及偏斜对称相关性回归模型的参数估计、异方差、相关性检验以及局部影响分析等问题,得到了一系列新的估计算法和检验统计量.大量的数值实例和随机模拟表明本文得到的方法和结果是有效的,也充分肯定了重尾对称分布在建模时的稳健性优势.