论文部分内容阅读
模型选择几乎是所有数据分析研究中必不可少的一部分。它主要研究的问题是如何从一些看似合理的候选模型中选出最合适的模型用于后续的统计推断分析。尽管模型选择在经济、生物、医学等诸多领域内有着广泛的应用,并且它的理论性质受到了很多学者的关注与研究,但是这些应用与研究中的绝大多数考虑的都是数据被完全观测到的情形,只有少数考虑的是数据有缺失的情形。在很多实际问题的研究中经常会出现数据有缺失的现象,如在问卷调查、医学研究、社会经济研究及其它科学研究中常会产生缺失数据。因此,发展适用于缺失数据的模型选择方法具有十分重要的现实意义。
模型平均是当代统计学以及计量经济学研究的热点问题之一。与模型选择不同的是,模型平均旨在通过利用一定的权重将各候选模型平均起来,从而达到降低估计或者预测的风险的目的。与模型选择相类似的是,模型平均方面的研究工作大多关注的也是数据被完全观测到的情形,只有极少的一部分关注数据有缺失的情形。目前,缺失数据下的模型平均相对来说算是一个比较新的课题,这方面还有很多重要且有意义的问题亟待解决。
本文研究缺失数据下的模型选择以及模型平均方面的一些问题,主要完成的工作如下。
(1)我们考虑协变量随机缺失时给定协变量下响应变量的条件分布的模型选择问题。基于经验似然方法,我们构建了针对该问题的模型选择准则,并在一定条件下证明了所得准则具有模型选择相合性。我们进行了数值模拟,并对所提方法以及相关的几种已有方法的有限样本表现进行了比较,模拟结果展示了我们所提方法的优势。除此之外,我们给出了三个具体的实例分析用于考察我们所提模型选择准则在实际应用方面的表现。
(2)我们考虑独立数据情形下响应变量随机缺失时线性模型的模型平均问题,并基于Mallows准则的思想发展了用于解决该问题的模型平均方法。我们在一定条件下证明了所提模型平均方法的渐近最优性,并通过模拟研究了我们所提模型平均方法的有限样本表现。
(3)最后,我们考虑随机误差向量的协方差阵是正定矩阵情形下响应变量随机缺失时线性模型的模型平均问题,并基于交叉验证的思想发展了用于解决该问题的模型平均方法,填补了这方面研究工作的空白。我们在一定条件下证明了所提方法的渐近最优性,并通过模拟展示了所提方法的优势。除此之外,我们给出了一个具体的实例分析用于考察我们所提模型平均方法在实际应用方面的表现。
模型平均是当代统计学以及计量经济学研究的热点问题之一。与模型选择不同的是,模型平均旨在通过利用一定的权重将各候选模型平均起来,从而达到降低估计或者预测的风险的目的。与模型选择相类似的是,模型平均方面的研究工作大多关注的也是数据被完全观测到的情形,只有极少的一部分关注数据有缺失的情形。目前,缺失数据下的模型平均相对来说算是一个比较新的课题,这方面还有很多重要且有意义的问题亟待解决。
本文研究缺失数据下的模型选择以及模型平均方面的一些问题,主要完成的工作如下。
(1)我们考虑协变量随机缺失时给定协变量下响应变量的条件分布的模型选择问题。基于经验似然方法,我们构建了针对该问题的模型选择准则,并在一定条件下证明了所得准则具有模型选择相合性。我们进行了数值模拟,并对所提方法以及相关的几种已有方法的有限样本表现进行了比较,模拟结果展示了我们所提方法的优势。除此之外,我们给出了三个具体的实例分析用于考察我们所提模型选择准则在实际应用方面的表现。
(2)我们考虑独立数据情形下响应变量随机缺失时线性模型的模型平均问题,并基于Mallows准则的思想发展了用于解决该问题的模型平均方法。我们在一定条件下证明了所提模型平均方法的渐近最优性,并通过模拟研究了我们所提模型平均方法的有限样本表现。
(3)最后,我们考虑随机误差向量的协方差阵是正定矩阵情形下响应变量随机缺失时线性模型的模型平均问题,并基于交叉验证的思想发展了用于解决该问题的模型平均方法,填补了这方面研究工作的空白。我们在一定条件下证明了所提方法的渐近最优性,并通过模拟展示了所提方法的优势。除此之外,我们给出了一个具体的实例分析用于考察我们所提模型平均方法在实际应用方面的表现。