复杂体系的变量共线性及模型过拟合研究

来源 :第十二届全国计算(机)化学学术会议 | 被引量 : 0次 | 上传用户:wwqq1200
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  复杂体系的化学成分建模过程中,变量间的多重共线性是常见的问题,为了消除共线性对回归模型的影响,常常使用偏最小二乘法。虽然PLS模型的交叉验证结果理想,但是外部验证结果却变差,PLS用于变量数比样本数要多的复杂体系建模时,将出现过拟合的现象[1,2]。共线性的问题导致一些变量对因变量的贡献很小,而且在模型的建立的过程中,过多的自变量,导致模型变得复杂,自预报的准确性,即交叉验证的有效性并不能完全代表模型的稳健程度,相反,完美的模型减少了样本空间的自由度,导致了模型出现过拟合,无法准确预报其他样本。所以,样本的变量选择是必要的。
其他文献
一、凡在我国境内设立的外商投资企业,在投资总额内购买的国产设备,对符合《国务院矢于调整进口设备税收政策的通知》(国发[1997]37号)中规定的《外商投资产业指导目录》鼓励类、限制乙类
目的 探讨维持性血液透析的护理措施及效果,方法 选择我院血液透析的患者进行随机对照试验,比较进行不同护理后二组的疗效.结果 研究组患者在护理质量、生活质量和护理满意度
  Chemical cross-linking of proteins coupled with mass spectrometry analysis (CXMS) is to covalently link two protein residues with cross-linkers and then to
会议
  Organophosphorus (OP) chemical warfare nerve agents, including sarin, soman, tabun, VX, VR, etc., are very neurotoxic compounds by inhibiting cholinesterase
会议
目的 研究正常护理与个性化护理对于乳腺肿瘤患者的治疗结果.方法 选择在我院治疗的患者100名,将其分为观察组与对照组,观察组采用个性化护理,对照组采用常规护理,比较两组患
不知大家有没有注意到这样一种现象,即思维敏捷勤于用脑的老人,其体魄往往要较同龄者强。著名国画大师刘海粟,在其90高龄时,尚能爬黄山、吞云海、画山岳,可谓古今奇人;英国
目的 研究探讨心理护理和健康护理对真菌性阴道炎患者的护理效果.方法 选取我院自2017年1月至2018年12月接诊的40例真菌性阴道炎患者,随机分为观察组(20例)与对照组(20例).对
会议