线性回归模型中多重共线性问题的应对策略及其几点改进

来源 :西南交通大学 | 被引量 : 0次 | 上传用户:kobe_lilei
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在解决许多实际问题中,需要使用解释变量对响应变量建立预测方程,但当涉及的解释变量较多时,解释变量间往往存在相关性;或者当取得的样本点数量小于解释变量个数时,都可以引起多重共线性问题,这时如果仍采用普通的最小二乘法来建模,那么这种多重共线性就会严重危害参数的估计、扩大模型误差、破坏模型的稳健性。 本文阐述了解决多重共线性问题的三种方法:岭回归方法、主成分回归方法、偏最小二乘回归方法,并对这三种方法进行了综述,且对它们的性质进行了归纳和总结,特别总结和归纳了基于方差最大性原则下的主成分分析的计算方法和步骤以及多因变量的偏最小二乘回归方法的计算方法和步骤。 本文讨论了岭回归、主成分回归和偏最小二乘回归的存在的一些问题,在岭回归中采用了一种基于均方误差无偏估计达到最小原则下选择岭参数K的新方法;在主成分回归中我们采用主成分的加权残差平方和来替代仅用残差平方和来筛选特征值的方法,明显改善了系统的误差,使得模型的精确度有了较大的提高;在偏最小二乘估计中我们从计算的约束条件着手,分析了解释矩阵中有较多信息且与响应变量具有较高相关性这种理想状态下的矛盾,采用了用正交投影的办法,把解释矩阵中与响应变量无关的成分扣除掉,经过这样处理的解释矩阵便不存在含有大量与响应变量无关的信息问题,从而扩宽了偏最小二乘回归方法的使用范围。同时还发现在偏最小二乘法当中利用交叉有效性原则选取主成分个数时,交叉有效原则并不是总是有效的,通过例题进行了说明。并且采用了一种基于”残差平方和的减小率”与Q_k~2准则相结合的方法来确定主成分的个数的新方法,这种准则是否合理,还需要我们在实践中进行检验。
其他文献
《画梦录》是何其芳早期的散文集,兼诗人和散文家于一身的何其芳在其早期散文作品中,为寻求创作抒情散文的新方向,以诗性为尺度开展文学实践,注重人格审美,表达本真的"自我",
<正> 在石油化学工业中,蒸馏是最重要且应用最广泛的化工分离操作。特别是在石油炼制和某些化工企业中,主要能量消耗均在蒸馏操作上。因此,研究探索蒸馏过程的节能途径并应用
借助于新型媒体的技术支撑,"恶搞"已成为一道独特的文化景观。而作为一种文化景观的普遍发生和迅速蔓延"恶搞",总有其深刻的心理根源。目前关于"恶搞"的研究主要集中在教育学
文章以扬州市S237省道北澄子河大桥健康监测系统为背景,采用倾角仪通过辛普森数值积分算法,计算跨中挠度,荷载试验实测结果表明倾角仪测量结果与水准仪实测值,相对误差在10%
目的掌握兰州地区近10年采供血状况与献血人群分布特征,为完善血源招募对策提供依据。方法以兰州地区近10年建立了电子档案的无偿献血者为研究对象,收集甘肃省红十字血液中心
发、齿、肾三者间的关系极为密切,祖国医学对此特别重视,因发、齿是肾的外候,肾是发、齿的根本。故从发齿可以了解肾的虚实、肾的强弱也可从发齿反映出来,三者本属同源:以肾
<正> 充血型心力衰竭一般是指慢性心功能不全(下称心衰),是内科较多见的危重病。其特点是发病急,变化快,反复率高,预后差。本病的发生主要由于素体元阳不足,而致五脏阳气虚衰
随着中国城市轨道交通的快速建设,城市轨道交通与周边土地利用不协同问题凸显,亟待加强两者互动关系的研究。本文总结了国外城市轨道交通与站域土地利用互动研究进展,以期为
市场经济条件下,各企业的市场竞争日益加剧,但是由于某些企业疏于财务管理,造成企业内部会计信息失真、生产经营成本过高、财会人员素质低下等问题,严重掣肘了企业的健康发展