基于混合采样策略的改进随机森林不平衡数据分类算法

来源 :重庆理工大学学报(自然科学) | 被引量 : 0次 | 上传用户:woai894781693
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对传统分类算法难以处理不平衡数据的问题,提出了一种基于混合采样策略的改进随机森林不平衡数据分类算法。首先从理论上分析了混合采样策略提升随机森林基分类器多样性的机理,随后设计了改进随机森林不平衡数据分类算法。算法采用过采样和欠采样混合采样策略为每棵子树生成不同的平衡训练子集,再利用该训练子集训练子树,从而创建随机森林分类器。最后用13种不平衡数据集进行实验测试。结果显示:采用较小的过采样因子可以取得较好的分类效果;与9种对照算法相比,改进的随机森林分类算法在AUC值对比时获得10个最优结果,G-mean值
其他文献
众所周知,家居环境是人们工作、学习及生活最重要的环境之一,其质量直接关系着人们的身体健康与日常生活。据了解,城市居民每天在室内的时间占全天时间的90%左右,儿童与老人
介绍了野生动物细菌性疫病的现状,通过对结核病、布氏杆菌病、魏氏梭菌病的阐述,提出了野生动物细菌性疫病防控策略,依法建立长期有效的防控机制,确保人与自然的和谐持续发展
中小企业在我国经济发展中占据重要地位,促进社会就业,增加人民财富,与人们生活息息相关。在中小企业发展过程中,企业融资难一直困绕着企业的生产经营和发展壮大。文章阐述中
西安飞机工业(集团)有限责任公司档案设施制造厂是一家有着十余年历史的、专门生产各种资料、档案、图书、办公设施,具有丰富经验的企业。他们自80年代开始先后开发、设计出M
注意力是马克思主义传播中媒体与受众连接的桥梁,增强互联网上马克思主义传播效果,必须抓住受众注意力这个关键,在新媒体中要发挥国家传播体系的强大功能,整合全球马克思主义传播
随着电子技术、嵌入式处理技术、信息处理技术的发展,各类环境信息数据采集变得尤为重要。水下信息检测技术在各类信息采集中是非常重要的。陆地资源已被大量开采,水下的资源
公租房旨在解决"夹心层"群体的住房问题,是"多渠道保障"的重要组成部分。从建设规模、租赁管理、租金等方面分析了我国公共租赁住房的发展现状,总结了主要的融资与运营模式,提出
文章在信息化背景下对于基层政府采购审计的策略进行了分析和研究,主要介绍了采购审计工作的内容和存在的问题,提出了解决的措施,为提升基层政府采购审计能力提供理论依据。