论文部分内容阅读
目的:研究logistic回归多重共线性的诊断方法,为模型的正确建立奠定基础。并且通过各种方法的比较,找寻适合于医学研究者使用的多重共线性诊断方法,便于医学研究者正确合理的建立logistic回归模型。方法:将多重线性回归的多重共线性诊断方法推广到logistic回归中。使用实例数据:某研究者进行的产后抑郁影响因素的研究,其中自变量包括与父母关系,人格量表EPQ的四个维度:EPQL、EPQE、EPQP、EPQN,既往抑郁史,产妇睡眠等。计算此实例数据自变量间的二元相关系数、方差膨胀因子、容许值、特征根系统、多重确定系数和行列式判别值。通过所得的计算结果,结合方法的易理解程度、操作的繁琐程度等综合判别几种方法的有效性和优缺点。结果:1.变量间二元相关系数:EPQE与EPQN, EPQL与EPQE, EPQL与EPQN, EPQP与EPQN的相关系数较大,存在共线性。2.方差膨胀因子与容许值:EPQE、EPQN的方差膨胀因子较大,容许值较小,此两个变量与其他变量之间存在多重共线性。3.特征根系统:四个特征根小于0.05,两个特征根小于0.01,模型中存在2-4个共线性关系。两个条件指数大于30。其中,条件指数为43.550对应的EPQL、EPQE的方差分解比例分别为88%和49%;条件指数为60.026对应的EPQE、EPQN的方差分解比例分别为48%和52%。EPQL与EPQE,EPQE与EPQN两对变量之间存在共线性。4.多重确定系数:除EPQN其他变量都可能引起多重共线性。5.行列式判别值:D=6.9296×10-10<0.01认为模型的某些变量间存在严重的多重共线性问题。6.根据几种诊断方法的结果,将存在多重共线性的变量移除,进行logistic回归得到的结论符合相关的文献研究。结论:logistic回归模型也对多重共线性敏感,因此需要对logistic回归模型的多重共线性问题给予重视。部分在多重线性回归中应用的共线性诊断方法在logistic回归的共线性诊断方面也同样适用。通过比较各种诊断方法,方差膨胀因子、容许值、特征根分析系统比较适合在医学研究中使用,既操作方便,又能够得到比较全面的结果,便于研究者进一步要采用合适的多重共线性解决方法来降低共线性对方程的危害,以得出正确的结论。