论文部分内容阅读
部分线性模型是一类广泛应用的半参数模型,它首先是由Engle(1986)提出来的.因为这种模型既包含了参数部分,又包含了非参数部分,因此它具有参数回归模型的良好的解释性和非参数回归模型的灵活性,在实际中做数据拟合处理时被广泛应用.然而在拟合的过程,我们常常不得不面临处理高维度的数据,但我们知道高维数据具有内部稀疏性,即随着维数ρ的增大,一个局部邻域所包含的数据点个数在整个样本中所占的比例越来越小,导致估计和拟合的精度下降很快,造成所谓的“维度灾难”,由此导出了变量选择问题.变量选择已经成为了统计学研究的热点课题之一,它已经成为提高预测精度和模型解释性的根本方法,具有重要的实际意义和研究价值. 本文研究了部分线性模型的变量选择问题,讨论了两类利用不同惩罚方法进行变量选择的问题,一类是利用Adaptive Lasso方法对参数部分进行惩罚,在不假定参数部分的协变量与非参数部分的协变量之间有回归关系条件下,我们证明了参数部分的惩罚估计量具有Oracle性质,即惩罚项的存在不会对非零系数的估计产生偏差,并且能够准确识别出非零系数.另一类是对参数部分和非参数部分分别使用样条光滑和Adaptive Lasso进行惩罚,我们也证明了惩罚估计量具有Oracle性质,并且能够准确识别出非零系数.本文还通过数值模拟的方法验证了方法在有限样本下的性能.