偏最小二乘及稀疏偏最小二乘回归的应用研究

来源 :昆明理工大学 | 被引量 : 14次 | 上传用户:malsway
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当今,高维复杂数据在各个科学领域广泛出现,这就要求统计学家寻求新的统计建模方法.处理高维数据的一个潜在难点是如何解决预测变量之间的多维共线性.偏最小二乘(PLS)回归是传统多元线性回归的推广,非常适用于具有强相关性数据的统计分析处理.偏最小二乘在建模过程中采用信息综合和筛选技术,从原有变量中提取若干对系统最具解释能力的新成分,然后再利用这些新的综合变量进行建模,可以说偏最小二乘是多元线性回归,主成分分析和典型相关分析这三者的综合.本文利用随机模拟的数据及云南省电力数据,从偏最小二乘的建模原理、模型求解、模型算法、算法模拟、参数调节、数据分析等方面对偏最小二乘模型展开了详细的研究和探讨,并利用交叉验证、均方差等准则对多元线性回归和偏最小二乘模型进行了综合比较,数据分析结果表明当预测变量之间存在较强的共线性时,偏最小二乘具有较高的优越性.本文的另一个研究重点是稀疏偏最小二乘(SPLS)回归.由于偏最小二乘的每个新成分都是原来所有预测变量的线性组合,当预测变量数较大时,这会给模型解释带来负面影响,也不利于最重要预测变量的寻找.稀疏偏最小二乘是偏最小二乘的改进,它能在偏最小二乘的基础上对估计系数进行收缩,并使那些较小的系数(绝对值意义下)恰好收缩到零,从而使与之对应的变量能够从模型中剔除.本文研究了稀疏偏最小二乘算法和实现,并采用类似于研究偏最小二乘的思路,对多元回归、偏最小二乘和稀疏偏最小二乘模型进行了全方面的比较,并就云南省电力数据,找出了影响电力消费的最重要因素.模拟数据回归结果表明:偏最小二乘回归及稀疏偏最小二乘回归模型可以有效解决变量之间存在共线性的问题.相比之下,稀疏偏最小二乘回归模型的拟合效果更好,模型预测精度更高.对云南省电力消费影响因素进行的研究表明:云南省的电力需求随着云南省经济的发展,社会消费品零售总额的增长以及固定资产投资的增加在不断增长.云南省的城镇化进程同样也拉动了全社会对电力的需求,居民消费价格指数的升高也对电力需求有正向的拉动作用,但作用不大可忽略.
其他文献
原发性痛经无生殖器官器质性病变,对于其治疗,中医或辨证论治拟方治疗,或采用中成药治疗,或采取针灸治疗等。也有综合运用各种治疗方法者。西医认为该病的发生于前列腺素升高
"愤怒的青年"的代表作家金斯利.艾米斯的代表作《幸运的吉姆》向高雅文化、精英文化发起了挑战。主人公吉姆对高雅文化的反叛,尤其是他在"可爱的英格兰"演讲会上对文化精英的
中国提出的与东盟共建新海上丝绸之路的倡议,使得传统的"海上丝绸之路"概念焕发出时代活力,这将是当前及未来一段时间中国力推的战略构想。这一战略应超越"遏制—制衡"的"相
谈谈对企业或有负债的理解陈立群,常颖所谓或有负债是指企业或许已经存在或许并不存在,情况目前尚未确定,需视事项的发展,才能确认将来可能需要承担的潜在债务。其基本特点是:1、它
为导航定位提供时间标准的导航卫星原子钟是非常精密的仪器,由于对外界环境非常敏感,无法将卫星钟差作为普通的白噪声处理,可以将卫星钟差看作是灰色系统来进行研究。根据灰
实事求是是毛泽东哲学思想的精髓。它体现了马克思主义内容与中华民族形式的统一 ,体现了唯物论、辩证法和认识论的统一 ,是无产阶级的世界观和方法论。它得到了全党和全国人
康德在其一生的著作中很少把道德与教育放在一起连用,但事实上他曾进行过从道德哲学进入道德教育的尝试。其道德教育思想可以分为三个部分:一是进行道德教育的前提,包括肯定
请下载后查看,本文暂不支持在线获取查看简介。DIM市场动态 Please download to view, this article does not support online access to view profile. DIM market dynamics
目的探讨复方芪术汤对四氯化碳(CCl4)致大鼠肝纤维化药效的干预作用。方法Wistar雄性大鼠30只,随机分为正常组10只和四氯化碳处理组(20只),四氯化碳1 ml/kg,每周2次腹腔注射,
本文以物业管理人员为对象,基于温州、杭州和福州等地区12个高端住宅物业服务项目中209名管理人员的调查数据,运用SPSS19.0和AMOS17.0软件,采用因子分析和结构方程模型分析相