论文部分内容阅读
函数型数据是一类重要的数据类型,它在社会学、经济学、生物医学、传染病学以及其它的自然科学领域有着广泛的应用.回归模型常用来研究协变量与响应变量间的相关关系,因为它灵活多变且能挖掘实际问题中响应变量和相关协变量间的潜在关系.近年来各种函数型回归模型受到广泛的关注和研究.基于此,本文对函数型响应变量线性模型的局部估计问题展开了若干研究,主要工作如下:(1)基于对上海儿童医学中心的婴儿身高数据和一些感兴趣的相关变量的研究,发现了观测的身高数据具有纵向数据特征,故在本文第二章选择了在纵向数据分析中广泛应用的变系数模型并对该模型提出一种函数型数据分析的估计方法.该方法结合函数型主成分分析和局部最小二乘估计方法,估计变系数的同时很好的考虑了个体内的相关性.并且建立了估计的变系数的弱收敛性.最后,通过数值模拟分析和实例应用都验证了所提估计方法的有效性.(2)进一步,为了研究上述感兴趣的协变量对多元生长曲线的影响并度量多元生长曲线间的相关性,本文在第三章考虑多元变系数函数型响应模型进行数据分析.结合一般加权下的局部线性估计与组合函数型主成分分析对上述模型提出了一个两步估计方法.该方法可以兼顾稀疏或稠密的观测数据,准确估计变系数函数的同时探究多元函数型数据的相依性.数值模拟和实例分析都证实了所提估计方法的稳定性和优良性.(3)不同于前两章基于单一样本的婴儿睡眠时间分析,接下来,第四章探索了一种简单的函数型Meta分析方法,该方法利用函数型数据分析的方式处理关于更为一般的婴儿睡眠时间研究的Meta分析问题.首先,采用函数型数据的均值-协方差模型,对所关心的多个国家的婴儿睡眠时间随年龄变化的趋势进行拟合.其次,基于逆方差加权法和最小二乘估计方法,考虑个体内的相关性与标准误差提出了一个有效的估计方法.然后建立了所得估计的大样本性质.通过数值模拟与现有方法相比较,说明了提出的方法优于现有的方法.最后,通过对若干个国家研究汇总的数据的分析说明所提出方法解决实际问题的优越性.(4)第五章研究一般加权条件下基于局部线性方法所得的函数型主成分的收敛速度问题,这一理论问题的研究使得包括婴儿睡眠时间在内的无论是稀疏还是稠密的函数型数据,都可通过不同权重的选择进行主成分分析.具体架构如下.首先,介绍在一般加权下均值和协方差函数估计的相关研究.其次,针对一般加权下的函数型主成分,即,特征值和特征函数,正文给出了相应估计值并推导其强一致收敛速度.最后,通过模拟研究验证所得的收敛速度.本文的估计方法和结论丰富了函数型线性回归模型的研究,将有助于分析在经济学、生物统计等应用领域中遇到的复杂多变的问题.