论文部分内容阅读
该次研究探讨了线性回归和logistic回归中共线特征指标.分析了线性回归中不同共线情况下BMA的变量选择问题,并结合应用探讨了BMA模型选择在线性回归模型、logistic回归模型以及Cox回归模型中的应用.主要结果如下:1、在线性回归中,回归系数估计的方差之和
∑<,i=1>Var(β<,i>)>σ<2>λ<-1><,min>.数据模拟的结果也验证了当抽样误差固定的时候,随着最小特征值的减少,回归系数的估计偏差和方差都增大.在最小特征值为0.01以下时,回归系数的方差相当大.最小特征值是一个能比较敏感地反映多元共线性的指标.相反,文献中经常提到的共线指标VIF却并不敏感.2、在线性回归中构造不同最小特征值的真实模型.用BMA进行变量筛选,发现BMA得到的后验概率P(β<,i>≠0|D)的相对大小能够明显地区分有关的变量和无关的变量.3、通过对线性回归、logistic回归以及Cox回归的实例的分析,得出下面的体会:a)BMA在上述三种模型中都能实现b)根据BMA得出的模型后验概率可以进行变量筛选.c)模型后验概率的绝对大小和符合BMA粗筛标准的模型的个数有关,模型个数越多,则模型后验概率会变小,但是相对大小不变.d)逐步回归得到的模型有可能并不是最大后验概率模型,所以逐步回归的最佳模型从Bayesian的后验观点来看,并不一定是概率最大的模型.e)通过参数后验概率p(β<,i>≠0|D),可以看出所有变量之间的相对重要性.对于逐步回归排除在外的变量,p(β<,i>≠0|D)也可以给出一个相对客观地评价.结合模型后验概率以及p(β<,i>≠0|D)可以给模型选择提供更多的信息支持.f)BMA得到的平均模型的参数估计值在加权平均后,总体来说比逐步回归得到的回归系数估计值稳健.但是,BMA得到的回归系数估计值在解释时比较困难.