RUSBoost算法在不平衡数据集上的应用

来源 :大连理工大学 | 被引量 : 0次 | 上传用户:dragonfly
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
不平衡分类问题是实际生活中的一种常见问题,例如疾病诊断、金融欺诈监测等。而大多数算法在处理分类问题时都会有一个前提假设,即数据分布是均衡的,这就造成了在对不平衡数据进行分类时,由于多数类样本的过度表现,算法在识别少数类样本时有将其识别为噪声的可能,因而会在不同程度上出现少数类样本的识别度下降的情况。而当我们无法获得更多的少数类样本时,可以考虑在抽样层面对不平衡数据进行改善,或是采用集成学习法着重对错误分类实例的预测。本文主要采用的RUSBoost算法,融合了欠采样和集成学习法,在样本容量较大时,欠采样能够充分体现它的优势,在平衡数据集的同时也提高了算法的运行速度。在实证分析阶段,本文选用的数据来自波兰制造行业的破产公司及健康公司的财务数据,自变量为64个财务比率,评估指标为AUC,sensitivity和G-mean。首先将RUSBoost的运行结果和AdaBoost的结果做了大量的对比实验。之后运用十折交叉验证法选择RUSBoost的欠采样比例参数和循环次数的一个合理的最优值。最后将确定的最优参数值代入算法对财务数据进行分类,均得到了较好的分类结果。
其他文献
近年来,随着计算机硬件资源的广泛提升和多媒体技术的飞速发展,目前越来越多的三维模型应用于影视制作、3D打印、游戏制作等等。三维模型的数量呈现出爆发式的增长,因此对于
空时自适应处理(Space-time Adaptive Processing,STAP)技术作为机载雷达最有效的杂波抑制手段,其研究已由相控阵体制雷达扩展到了MIMO体制雷达,现有研究已表明MIMO雷达相比
含挥发性有机化合物(VOCs)气体主要来自于石油化工、制药工业、印刷工业、交通运输等行业排放的尾气中。VOCs是危害人体健康的主要污染物质之一,对人的眼、鼻、呼吸道有刺激
基于数字微镜器件(Digital Micromirror Device,DMD)的数字光刻技术具有灵活高效的特点,该技术广泛地应用于多种领域,如:电路板线路制造、微光学器件制造、生物芯片制造等。微纳光学器件的体积小而且功能丰富强大,特别适合现在微型化、高集成化的需求,例如人脸识别领域中的结构光投影模组的核心器件就是达到亚微米级的衍射光学元件。低成本、高效率和高精度地制造和生产微纳光器件的问题,不仅
由于无线频率资源是有限的,并且在通信系统中存在着大量的干扰,因此如何有效的提高频谱的利用率是一个非常重要的问题。干扰对齐(Interference Alignment,IA)是一种有效的干
斜拉桥因其巨大的跨越能力和相对良好的空气动力稳定性在国内外得到了广泛的应用,斜拉索作为整个结构体系的生命线,起着联系和支撑桥面主梁与索塔的作用,然而斜拉索本身的材料特性和拉索系统长期暴露在自然环境中,导致斜拉索极易被腐蚀断裂。针对这一问题,本文通过钢绞线电化学加速锈蚀试验和单向拉伸试验,得到了钢绞线的腐蚀行为特征和腐蚀程度随时间变化的规律。对比三种钢绞线腐蚀损伤率评定方法,总结了三种计算方法对不同
目的探讨急性基底动脉闭塞行血管内治疗患者短期预后的预测因子。方法选取我院2015年5月至2019年9月期间收治的83例急性基底动脉闭塞行血管内治疗患者,其中38例90d预后良好(m RS 0-2),45例90d预后不良(m RS 3-6),对有统计学差异的基线资料和手术相关结果及并发症行多因素Logistic分析。结果多因素Logistic回归分析表明,卒中相关肺炎(OR=6.910;95%CI:
随着我国经济的快速发展发展,企业在日常经营过程中所面对的不确定性因素逐渐增加,这也致使企业在日常经营中所面临的财务风险问题也不断加剧。电子行业是我国现在发展迅猛的一个行业,其发展对我国经济的发展起着一定的推动作用。电子产业的特征是规模大,科学技术发展快,产业所具有的关联性比较强,对我国国民经济的发展起着非常重要的作用。近年来,我国电子行业面临竞争压力严峻、产品出口国外问题严重等多方面的挑战,使得企
目的探讨头颈部淋巴瘤的影像表现及其与病理类型之间的相关性。方法收集具有完整临床、影像学和病理资料的头颈部淋巴瘤患者52例,其中男39例,女13例,年龄29~81岁,平均年龄55岁,33例行CT检查,15例行MRI检查,4例同时行CT及MRI检查,所有CT和MRI包括平扫和增强检查,以上所有病例均经手术或穿刺活检病理证实。根据影像表现的不同特征进行影像学分型,对照研究头颈部淋巴瘤影像学特征与病理学分
随着微创消融技术的不断发展,射频消融(RFA,Radiofrequency Ablation)技术已广泛地用于治疗肝肿瘤疾病。相比于传统的外科肝肿瘤切除术,RFA技术具有微创、安全、适应症广、术后恢复快和费用低等优点。特别是针对肿瘤较多或肿瘤位于不可切除部位的患者,热消融技术已成为行之有效的治疗手段。但由于患者个体间存在着较大的差异性,消融治疗效果主要依赖于医生的经验,难以对患者进行适形治疗,导致