【摘 要】
:
针对不平衡数据集的有效分类问题,提出一种结合代价敏感学习和随机森林算法的分类器。首先提出了一种新型不纯度度量,该度量不仅考虑了决策树的总代价,还考虑了同一节点对于
论文部分内容阅读
针对不平衡数据集的有效分类问题,提出一种结合代价敏感学习和随机森林算法的分类器。首先提出了一种新型不纯度度量,该度量不仅考虑了决策树的总代价,还考虑了同一节点对于不同样本的代价差异;其次,执行随机森林算法,对数据集作K次抽样,构建K个基础分类器;然后,基于提出的不纯度度量,通过分类回归树(CART)算法来构建决策树,从而形成决策树森林;最后,随机森林通过投票机制做出数据分类决策。在UCI数据库上进行实验,与传统随机森林和现有的代价敏感随机森林分类器相比,该分类器在分类精度、AUC面积和Kappa系数这3种
其他文献
淳朴的人性美──浅谈《边城》的思想倾向赵连文沈从文是我国现代文学史上较有影响的作家之一。1928年后连续出版了《人伍后》、《旅店及其他》、《虎雏》、《都市一妇人》、《边
哈萨克族是一个勤劳、善良“随水草而迁居”的游牧民族,自古以来便是中华民族大家庭中的成员之一。由于历史的变迁,哈萨克族主要分布在中国、原苏联、蒙古三国边境。居住在我
研究制动力作用下车辆-结构耦合系统的分析方法。以刚体动力学方法建立车辆子系统模型,以振型叠加法建立结构子系统模型,以给定的制动加速度时程、简化的Kalker蠕滑理论和轮
由于契约的不完备性、代理和信息不对称问题的存在,导致财务控制的需要。财务控制系统的设计及其运行都会导致企业资源的消耗,这就是财务控制成本。财务控制成本包括设计成本、
在内隐认知理论和缄默知识理论视野下,语感的三维内涵包括:其一,是指学习主体在进行言语活动时对语言知识和言语知识的内隐学习;其二,是指学习主体内隐学习的结果,是关于语言
在央向对象程序设计中,继承性是导致语义复杂性的因素之一。本文讨论了作为代码共享机制的继承和表示功能特殊化的子类型的共存及相互关系,采用了将行为规范视为类型的概念,即类
财务管理是企业管理的核心,而财务风险防范又是财务管理的重要原因和目的。在企业发展的整体目标之下,如何根据有关的财经法律、法规,通过科学的财务管理制度合理规避企业在
为避免污泥产生的二次污染及充分利用污泥中的有效成分,对污泥进行堆肥处理是较好的污泥处理方法。考察了污泥含固率和pH值对污泥堆肥过程的影响。结果表明,污泥可堆肥的含固率
在工程建设项目中采取公开招标方式选择施工企业,极大地节约了建筑成本、提升了建筑质量、提高了经济效益。但在实际工作中用招投标方式选择交易主体的同时又引发了一系列新
按频域法、时域法、时频法对环境激励下结构模态参数识别方法进行分类,根据国内外最新的研究动态,对运行模态分析各种方法的识别理论、适用条件和识别精度进行论述,并比较了