论文部分内容阅读
在实际问题中,我们经常遇到参数维度随着样本量而增加(参数维度发散)的高维数据.基于线性模型的高维数据的统计研究方法比较成熟,然而对于Tobit模型和相对误差模型,这一领域的研究比较少.众所周知,Tobit模型在计量经济学领域中有着广泛的应用,以及在分析一类刻度变化数据时,相对误差模型比绝对误差有着更好的合理性.所以,本文主要研究了当参数维度发散时Tobit模型和相对误差模型的统计推断问题.首先,本文研究了当参数维度发散时Tobit模型中参数估计的渐近性质,包括相合性、渐近正态性、收敛速度以及变量选择.所研究问题的难点在于:(1)参数维度随着样本量增加时,参数空间、设计阵等的条件假设与参数维度固定时的情形不同;(2)基于Tobit模型的最小绝对误差准则非凸且不光滑,以往关于线性模型的研究方法不适合解决所研究的问题;(3)传统经验过程中的极大值不等式假设参数维度是固定的.于是,我们建立了参数维度发散时一个极大值不等式,所得不等式不依赖于Tobit模型,可以应用到其他的模型中去.最小化绝对误差准则给出Tobit模型中参数的一个估计,即最小绝对误差(LAD)估计.在一些正则化条件下,利用所提不等式,我们得到了参数估计的统计渐近性质:弱相合、以概率收敛速度和渐近正态性.为了避免估计渐近正态分布中的冗余参数,例如误差项的密度函数,我们采用随机加权再抽样方法来逼近参数估计的渐近分布.据我们所知,当参数维度发散时,文献中关于参数估计的强相合性问题的研究比较少,即使基于简单线性模型的研究也几乎没有.本文证明了当参数维度和样本量满足一定条件下Tobit模型LAD估计的强相合性,获得了它的几乎处处收敛速度.我们指出收敛速度和参数维度的阶有关,当参数维度随着样本量增加的速度越大时,估计的收敛速度越慢.另外,所得结论也包括参数维度固定的情形.我们通过构造数值模拟和分析实际数据,说明所提方法的有限样本性质.变量选择是统计学的一个重要研究方向.文献中关于Tobit模型的变量选择方法主要集中于参数维度固定时的情形.随着科学技术的发展,研究对象的观测因素会越来越多,特别会随着样本量的增大而增大,但实际对研究对象有影响的因素比较少.为了提高模型的预测精度,建模中选取重要的影响因素是非常必要的.考虑参数维度发散的Tobit模型,除了绝对误差准则,我们再给予参数一个非凹的惩罚函数.在一定的正则条件下,例如解释变量的系数具有稀疏性,本文证明了 Tobit模型的变量选择方法具有Oracle性质.模拟结果展示了我们的估计方法可以区分非零系数和零系数,并且给非零系数的一个良好的估计.最后,本文建立了参数维度发散时相对误差模型的统计性质:参数估计的渐近性质和线性假设检验性质.由于计量单位和观察数据数量级等不同,相对误差准有时候比绝对误差准则分析数据更加合理,例如股票数据等.文献中关于相对误差的研究有很多,但都需要参数维度固定这个假设.在参数维度发散的相对误差模型下,我们分别提出参数估计的最小乘积相对误差准则和广义的相对误差准则.在一定的条件下,得到了参数估计的相合性和其线性组合的渐近正态性.进一步,我们考虑参数的线性假设检验问题,给出检验问题的一个M型统计量,证明了检验统计量的极限性质.在数据模拟和实际数据分析中,我们比较了 3个准则的估计效果,它们包括最小乘积相对误差准则,最小相对误差绝对值准则和最小二乘准则,结果表明了相对误差方法的合理性和有效性.