多类不平衡数据分类方法综述

来源 :计算机应用研究 | 被引量 : 0次 | 上传用户:sjt111
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
现实中许多领域产生的数据通常具有多个类别并且是不平衡的。在多类不平衡分类中,类重叠、噪声和多个少数类等问题降低了分类器的能力,而有效解决多类不平衡问题已经成为机器学习与数据挖掘领域中重要的研究课题。根据近年来的多类不平衡分类方法的文献,从数据预处理和算法级分类方法两方面进行了分析与总结,并从优缺点和数据集等方面对所有算法进行了详细的分析。在数据预处理方法中,介绍了过采样、欠采样、混合采样和特征选择方法,对使用相同数据集的算法的性能进行了比较。从基分类器优化、集成学习和多类分解技术三个方面对算法级分类方法展开介绍和分析。最后对多类不平衡数据分类研究领域的未来发展方向进行总结归纳。
其他文献
随着水产养殖业的蓬勃发展,抗生素及抗生素抗性基因在水产养殖环境的多种介质中被频繁检出,促进了细菌耐药性和多重抗性基因的发展。目前常用的水处理技术无法完全去除养殖排放尾水中残留的抗生素及其抗性基因,这些养殖尾水排放到自然环境中严重威胁了生物及生态环境。本文通过综述抗生素及其抗性基因在水产养殖环境中的污染及危害程度,分析评价水产养殖常用的水处理技术消除抗生素及其抗性基因的原理及效果,可为建立水产养殖尾
报纸
随着信息传播技术的迅猛发展,媒介要素在优化生产要素流通过程的同时,也重构了生产力和生产关系的结构和形式。以列宁帝国主义理论审视当今媒介帝国主义的生成发现,当代发达资本主义国家为了实现资本增值,已经全面开启了媒介垄断这一帝国主义新样态。在资本要素运行逻辑的支配主导下,这些媒介帝国主义国家通过集中控制媒介资源以及形塑媒介环境等方式,在全球范围内开展媒介殖民。这对全球经济社会可持续发展构成了现实威胁。面
针对地铁建设与运营过程的中的沉降问题已经成为当前城市建设中的一个严峻地质灾害问题,采用时序InSAR技术获取2017年11月—2020年8月合肥市城区及周边地面形变分布信息,系统分析了合肥市主城区的地铁沿线地表沉降时空演化规律。形变区空间分布存在合肥市北部、中部的地铁线路沿线相对稳定,西部、南部线路有区域性的不均匀沉降问题,部分线路的沉降速率较大。运用时序InSAR技术监测地铁沉降的研究结果表明:
目的 探究精细化护理干预对痔疮手术患者术后疼痛、伤口愈合的影响。方法 采用随机数字表法将90例痔疮手术患者分为常规组(n=45,常规护理干预)和观察组(n=45,精细化护理干预)。比较两组的干预效果。结果 观察组术后1、2 d的视觉模拟评分法(VAS)评分均低于常规组(P<0.05)。观察组术后72 h内最高VAS评分低于常规组(P<0.05)。观察组出院前的创面评分显著低于常规组,创面愈合时间明
据《中国常见恶性肿瘤患者营养状况调查》显示,中国恶性肿瘤住院患者营养不良的发生率高达80%,中重度营养不良的发生率高达58%。其中,26.1%的患者重度营养不良,仅有19.6%的患者无营养不良。大量临床实践证明,营养治疗可以增强各种临床治疗手段效果,
期刊
在中国和日本,关于鲁迅之死的争议已有相当长的时间,一场国际调查随之展开。医生团队研究存世的鲁迅肺部X光影像;中日学者追究草写的“五”会否被错认作“三”;一位政府资助的日本医学史学家环球旅行,找寻为鲁迅做检查之美国肺病专家托马斯·B·邓恩医生的后代和坟茔。笔者亦曾数次参与到该跨国项目中。本文追溯“鲁迅之死”争议的历史渊源——自20世纪30年代至80年代,结合中国大陆、台湾和日本当时状况,以历史证据,
在旅游产品创意设计课程的教学中,笔者提出将项目教学法融入教学设计中,让学生从被动接受到主动创作。在大力发展旅游业的今天,贵州旅游产品的开发还处于起步阶段,在与贵州民族文化结合的设计上面临着巨大的困难与挑战。通过校企合作,积极探索发掘贵州旅游产品的本土民族文化元素,并将之运用到真实或模拟的项目当中,从而更加有效地推动产业发展和产品升级。课程改革通过几年的努力初有成果,实现了让更多的人们了解到灿烂多彩