基于欠采样和代价敏感的不平衡数据分类算法

来源 :计算机应用 | 被引量 : 1次 | 上传用户:qianqian3580
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对不平衡数据集中的少数类在传统分类器上预测精度低的问题,提出了一种基于欠采样和代价敏感的不平衡数据分类算法——USCBoost。首先在AdaBoost算法每次迭代训练基分类器之前对多数类样本按权重由大到小进行排序,根据样本权重选取与少数类样本数量相当的多数类样本;之后将采样后的多数类样本权重归一化并与少数类样本组成临时训练集训练基分类器;其次在权重更新阶段,赋予少数类更高的误分代价,使得少数类样本权重增加更快,并且多数类样本权重增加更慢。在10组UCI数据集上,将USCBoost与AdaBoost
其他文献
粉煤灰是工业三大废渣之一,它作为一种无机结合料在我省道路施工中得到一定的普及,文中重点探讨粉煤灰在修筑路面结构层作为无机结合料的可行性,各项指标均符合公路技术规范
目前,物联网产生的繁杂的数据,缺乏有效的管理方法。云和集群技术提供了解决这些问题的思路。文章旨在建立数据挖掘与物联网的关系本文讨论了一种基于actors模型和物联网概念的数据挖掘算法的分布式执行方法。该方法允许将数据挖掘算法分解为参与者,并在分布式环境中执行。该模型将应用在物联网的集中系统(云计算)和分布式系统中提供数据分析。实验表明,文章所提出的模型提高了数据分析的性能,减少了终端设备和云之间的
随着人们对雷电灾害的重视程度不断提高,对防雷设施的防雷要求也越来越高,所以纳米碳防腐导电接地装置等新型接地产品应运而生,开始逐步替代普通镀锌接地产品。
以驴胎盘为研究对象,对其活性成分进行研究。采用电感耦合等离子体质谱技术(ICP-MS)与电感耦合等离子发射光谱技术(ICP)对37种元素进行分析,并对有响应值的元素进行定量,数据
提出了一种摆幅可调型足部康复机器人。根据踝关节运动方式和足底穴位分布,设计足部康复机器人的整体结构,并且重点介绍了摆幅可调传动机构的运动原理。运用反转法进行传动比
为科学有效地防治枸杞黑果病,选用等量式波尔多液100倍液、50%退菌特可湿性粉剂、70%代森锰锌+75%百菌清600倍液、25%苯醚甲环唑乳油,连续3 a进行田间防治试验。结果表明,一