论文部分内容阅读
似乎不相关回归模型(seemingly unrelated regressions model SUR)是由多个回归方程组成的方程组,它与多元回归模型(multivariate regression model)的区别在于允许各方程存在不同的自变量,这样的特性给统计建模带来很大的灵活性。同时,SUR在参数估计过程中利用了方程间误差向量的相关信息,使参数估计效率在满足某些适当条件下较之对各个方程分别进行参数估计的传统方法得到改进。在医学研究领域,由于健康与疾病现象的复杂性,不同健康或疾病状况受不同因素的影响,甚至不同特征人群的同一健康或疾病状况也可能由不同因素所导致;另外,由于受某些已知或未知因素的共同影响,不同健康或疾病指标间常常存在或多或少的相关性。因此,SUR模型在医学研究中有重要的应用价值。本课题结合多个医学实例,系统探讨似乎不相关模型的统计学建模和参数估计方法,包括似乎不相关线性回归、似乎不相关非线性回归和似乎不相关广义线性回归,并向非参数和半参数推广,重点解决空气污染对人群健康弱效应影响的基于多个时间序列数据的似乎不相关半参数模型建模问题。我们在第一章探讨了似乎不相关线性回归模型的基本模型结构,概括其与多变量线性回归模型(multiple linear regression)和多元线性回归模型(multivariate linear regression)之间的关系;给出模型参数的Zellner两步估计、迭代估计和极大似然估计方法及其大样本性质;当模型误差向量的方差—协方差矩阵为对角结构时,采用SUR的估计效率并不优于对每个方程分别作普通最小二乘估计,因此有必要事先对模型误差向量的方差—协方差矩阵为对角结构进行检验;给出模型拟合优度检验的统计量及其构建方法;方程组参数的线性约束假设检验比单个方程的参数假设检验有更丰富的内容,在方程组中可以检验一个方程的参数与其它方程的参数之间是否存在特殊的关系,我们讨论了模型参数向量行间和列间比较的一般方法。指出在小样本情况下模型估计参数的标准误可能被低估,在SUR框架下无法单纯通过自助抽样法改进标准误从而解决问题。针对上述问题,讨论了基于渐近关键检验统计量的自助抽样法。本章用一个两方程的似乎不相关回归模型的Monte Carlo模拟实验考察了各个样本量情况下SUR估计量与OLS估计量的相对估计效率,并显示在小样本情形下SUR模型假设检验水平失真的情况,证明了bootstrap方法在这种情况下能降低失真度。以老年人认知功能减退影响因素研究为例,说明似乎不相关回归模型在医学中的应用及其特点。第二章讨论了非线性似乎不相关回归模型的参数估计方法及估计参数的大样本性质,指出方程间确实有相关关系,且各方程的自变量xt i不全相同,并且每一方程的非线性函数f i ( x ti ;θi)形式不同,则与线性情形一样,非线性似乎不相关回归优于普通非线性最小二乘估计。简单介绍Volund提出的用以拟合S型剂量—反应关系曲线的非线性模型,并以四氯化碳CCL4的肝细胞毒性的剂量-反应关系及其与时间关系的毒理学试验研究为