【摘 要】
:
本文旨在研究对非平衡数据建模时,SMOTE过抽样和随机欠抽样的不同比例对模型预测效果产生的影响.首先基于模拟数据,探究了混合抽样比例的不同组合下,带有LASSO变量选择的逻辑
【机 构】
:
中国人民大学统计学院国网能源研究院有限公司;
论文部分内容阅读
本文旨在研究对非平衡数据建模时,SMOTE过抽样和随机欠抽样的不同比例对模型预测效果产生的影响.首先基于模拟数据,探究了混合抽样比例的不同组合下,带有LASSO变量选择的逻辑回归模型对于非平衡程度不同数据的分类效果.模拟结果表明,过抽样和欠抽样的比例越高,预测效果越好,但是在某些情况下,直接使用原始数据进行建模,选取一个合适的临界值,可以得到更理想的分类模型.通过对某担保公司的数据实证研究发现,前述结论基本成立,且当原始数据极不平衡时,采用混合抽样方法进行数据预处理可以有效提高模型的预测效果,这对于非平衡数据的建模分析过程有一定的指导意义.
其他文献
微机电技术、传感器技术和无线通信技术的进步,推动了低功耗多功能的传感器的快速发展,使其在微小体积内便能够集成信息采集、数据处理和无线通信等功能。无线传感器网络就是
随着世界工业和经济的快速发展,大量化石燃料燃烧导致大气中的CO2浓度逐渐增加。大气中的CO2浓度已由工业革命前的280 μmol·mol-1上升到当前的409 μmol·mol-1。在温室气体排放中等稳定化情景下,2100年大气CO2浓度预计达到538~670 μmol·mol-1。农业是对气候变化反应最为敏感和脆弱的领域之一,粮食产量关系到国家安全与稳定。为进一步探究不同CO2浓度升高水平主要粮
新年伊始,万象更新.rn作为一本国家统计局主管、中国统计学会主办的月刊,《调研世界》已走过 30 个春秋,经历一次更名、一次改版,一直在追求高质量学术道路上砥砺前行.
整数可逆变换是将整数映射为整数的一一变换。由于计算机表示和计算精度有限,所以常见的线性变换,如DCT变换和小波变换,不能直接实现整数信号的完全重构,使得人们在进行整数像素
人工耳蜗是目前唯一能使全聋患者恢复听觉的装置,它是向功能尚完好的听神经施加脉冲电刺激来传递声音的。它可以分为体外部分和体内部分,而体外部分的语音信号处理器是人工耳蜗
致力于“在特定的垂直领域成为国际领先的定制芯片供应商”的广东跃昉科技有限公司正式落户顺德.在2020年1月17日的揭牌仪式上,格兰仕集团副董事长、跃昉科技CEO梁惠强表示,
本文针对显微镜物镜焦深范围有限,显微样本成像时需要一序列图像才能聚焦清晰特点,对显微图像融合方法进行了研究,提出了一种快速序列图像配准和融合方法,并初步实现了整套系统。
超声波的检测和降噪在工程中有着重要而广泛的应用。
小波变换是继傅立叶变换之后,数学和信息科学应用结合的又一典范,为时频分析提供了一种灵活多变的选择,也有一些其他信
本文以武汉市中心城区调研数据为例,采用Lasso-Logistic回归方法分析了2014年7月1日以来我国以房养老试点失败原因以及人们参与以房养老的主要影响因素.研究表明:第一,目前武