论文部分内容阅读
与参数方法相比,非参数方法可以根据观测数据更加灵活地构建模型从而减少建模偏差带来的风险,帮助人们选择适当的参数模型。作为常用的非参数方法之一,样条光滑法具有简单易行和计算速度快的优点。本文将采用样条光滑法对非参数时间序列回归模型和含有连续型区间删失协变量的线性回归模型中的三个问题进行研究。在第二章中我们采用样条光滑法对非参数时间序列回归模型中条件方差函数的估计及置信带构造的问题进行了研究。首先,我们采用样条光滑法得到条件均值函数的样条估计,然后,基于残差再次采用样条光滑法得到条件方差函数的样条估计。在a混合条件下,我们推导出一致收敛速度。进一步,我们采用常数样条和线性样条构造了条件方差函数的同时置信带。同时置信带可以用于检验条件方差函数是否具有某种参数形式。例如,检验条件异方差是否存在或检验条件方差函数是否是二次函数等。在模拟中,我们不仅考虑了条件均值函数和条件方差函数都光滑的例子,也考虑了条件均值函数或条件方差函数不光滑的例子。在实例中,我们对S&P500指数进行了研究。通过模拟和实例的研究,我们发现所提的方法可以得到较好的估计结果,而且比常用的局部多项式光滑法的计算速度快。在第三章中我们采用样条光滑法对非参数时间序列回归模型中的条件均值函数进行了跳点探测的研究。我们假设条件均值函数中跳点的数量、位置和跳跃幅度都是未知的。首先,我们采用样条光滑法得到条件均值函数的样条估计。然后,根据相邻节点间条件均值函数的样条估计的最大差值构造探测跳点是否存在的检验统计量,并在条件均值函数连续的原假设下得到了检验统计量的极限分布。之后我们根据检验统计量判断出与真正的跳点相邻的节点,用节点来推测跳点的位置,再通过增加样条基函数的方法对数据再次拟合来估计跳跃的幅度。在模拟中,我们对500次重复试验中探测出跳点的频率、探测跳点数目出错的频率及跳点的覆盖率进行了详细的分析。在第四章中我们对含有连续型区间删失协变量的线性回归模型的参数估计问题进行了研究。含有区间删失协变量的线性回归模型是由Gomez、Espinal和Lagakos[9]于2003年根据一个AIDS临床试验的研究提出的。Gomez等[9]研究的被删失的协变量是离散型随机变量。为了估计回归系数,Gomez等[9]提出一种求似然函数极值的方法,同时也提出一种两步算法来寻找似然函数的极大值。但是,Gomez等[9]的迭代算法复杂且耗时很长,而且Gomez等[9]也指出她们的算法不适用于被删失的协变量是连续型随机变量的情况。在本章中,我们对这个尚未解决的难题——当被删失的协变量是连续型随机变量时如何估计回归系数的问题进行了研究。我们提出了一种快速算法来估计线性模型的回归系数。首先,基于Stone[54]、Kooperberg和Stone[55]的对数样条(logspline)模型,我们得到被删失的协变量的密度函数估计和分布函数估计。然后,我们利用条件期望构造了一个变量来取代被删失的协变量。最后再通过最小二乘法得到回归系数的估计。在模拟中,我们把所提的方法与中点替代法和半参数贝叶斯方法进行了比较。通过大量的模拟研究,我们发现在删失区间长度可变的情况下,我们的方法可以得到更精确的估计结果和更小的MSE值,而且其运算速度是半参数贝叶斯方法的100倍。在第五章中,我们对前三章内容进行了总结,分析了我们的方法的优点和不足之处,并提出了进一步的研究方向。