论文部分内容阅读
随着科技的发展,越来越多的数据在一个时间区间或不间断的离散点上被记录,这些都是函数型数据。函数型数据已经成为统计研究中的一个重要领域。作为稀疏函数型数据中的一类,纵向数据因其在医学等领域中的广泛应用也已经得到了长久的发展。在回归模型中加入交互效应可以提高模型的解释能力,有时交互效应本身就是人们感兴趣的量,例如与协变量相关的处理效应其实就是协变量与处理指标间的交互效应。虽然在模型中加入交互效应会增加其复杂度,填补函数型数据下这类模型的空白是很有必要的。本文的研究内容分为以下三部分:(1)研究了含单指标交互效应的广义函数型线性模型的预测问题。我们用函数型主成分分析对函数型自变量进行降维。基于截断的主成分序列,我们极大化一个局部拟似然函数,用迭代算法得到模型的估计。假设截断参数趋于无穷,我们证明了,在截断参数一个较宽的范围内,对非参函数的不同窗宽,模型的参数估计是(?)相合且渐近正态的。另外,模型整体预测误差由单指标交互效应中非参函数的估计误差控制:基于此我们提出了一个基于CV的方法来选取调节参数。我们还证明了函数型部分的预测误差具有Cai和Hall(2006)中给出的minimax意义下的最优速度。最后将方法应用于作物产量的预测,结果表明与传统的函数型线性模型和其它非线性函数型回归模型相比,我们的模型具有更小的预测误差。(2)将含单指标交互效应的广义函数型线性模型推广至多元函数型自变量的情况,我们用多元函数型主成分分析对多元函数型自变量进行降维。将基于MAVE的广义拟似然方法应用于截断的模型,得到了模型的估计。假设截断参数随样本量增大趋于无穷,我们给出了在截断参数一个较宽的范围内,对非参函数不同的窗宽,参数估计和非参数估计的大样本性质。模型预测误差的理论结果在多元函数型数据下依然成立,数值模拟和实例分析的表现与理论结果一致,这说明基于CV的调节参数选取方法在多元函数型自变量的情况依然适用。最后,我们将模型应用于玉米产量的预测,进一步降低了预测误差。(3)在个性化医疗的背景下,考虑了纵向数据下的一个广义部分线性单指标混合效应模型,其中处理效应由一个半参数单指标项来刻画。模型允许处理效应随病人的多个基础特征或时变特征而变化。我们提出了一种结合局部线性技术和惩罚拟似然的估计方法来得到模型的估计,并给出了适合的算法。另外在一定的正则条件下,证明了参数估计和非参数估计的渐近正态性。最后,数值模拟结果说明所提方法具有良好的有限样本性质。本文的方法和结论丰富了函数型数据下含交互效应回归模型的研究,有助于分析在农业、医学、经济学等领域的实际问题。