关于AdaBoost算法中样本加权方式的改进研究

来源 :华北电力大学(北京) | 被引量 : 0次 | 上传用户:iuonake5
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
集成学习算法是目前非常有效的机器学习框架,其中Boosting算法通过串行将弱学习器组合成强学习器,进而能很好的拟合真实模型,解决实际问题。在以Boosting思想为基础,进而提出了 AdaBoost算法。该算法不仅分类精度高,且易实现,所以AdaBoost算法在模式识别、计算机视觉等领域都得到了广泛应用。但是通过深入研究,发现AdaBoost也有缺点。AdaBoost在面对复杂样本时容易出现退化现象,分类精度会下降。同时AdaBoost算法也很难准确分类不均衡数据集,小类样本分类错误率很高,整体分类效果较差。本文针对算法上述的缺点,对其样本加权方式进行了改进。首先在面对退化问题时,AdaBoost算法会对易分错的交叉样本和噪声样本不断增加样本权重,导致整体分类性能退化,对此本文先给一个阈值,当分类错误次数大于阈值,将不再增加样本权重,以此来遏制算法的倾斜。其次在面对非均衡数据集时,在小类样本分类错误时给予更大的样本权重,即使分类正确也不减少其权重来使算法在分类过程中更加关注小类样本,从而提升AdaBoost算法整体对非均衡数据集的分类能力。最后通过大量的实验验证了改进AdaBoost的稳定性和有效性。
其他文献
人体的运动是通过骨骼肌来完成的,肌肉细胞想要创造和保持运动所需的张力,其组织的机构化必定十分缜密。肌细胞内各种变化也十分多样切复杂,例如分解条件下会调动起来的变化
教育公平是社会公平的基础,城乡教育均衡发展是教育公平的基石,推进城乡义务教育均衡发展是缩小城乡差别,加快城乡一体化发展的重要前提。为推动保靖县城乡义务教育发展上台阶,笔
报纸
<正>0引言某CPP(调距桨)油化船,主机型号6UEC37LA,增压器型号MET33SC,在出港后定速航行约1h后,主机扫气箱着火、涡轮增压器爆炸,导致船舶长时间停航,损失惨重。1事故经过某日
<正>【作品简介】《汤姆叔叔的小屋》,又译作《黑奴吁天录》和《汤姆大伯的小屋》,作者是美国女作家比彻·斯托夫人(1811—1896)。斯托夫人住在与南部蓄奴的村镇仅一河之隔的
<正>我们说,长征是历史纪录上的第一次,长征是宣言书,长征是宣传队,长征是播种机。自从盘古开天地,三皇五帝到于今,历史上曾经有过我们这样的长征吗?十二个月光阴中间,天上每
期刊
对错误解题过程进行分析和思考,归纳错误情况,追踪错题原因,强化知识理解,试图寻找教学中存在的问题,探究应对策略,最终实现对考查知识点的重新理解和学习,进而提高教学的有效性.
随着我国社会主义市场经济的不断发展与完善,企业面对的市场情况越来越复杂,且变化越来越快,这就要求企业领导者能正确分析,处理这些问题,作出明智的,符合企业实际的决策,本文仅就工
Cu-Al-Ni-X系形状记忆合金(Shape Memory Alloys,SMAs)是一类具有较高相变温度和热稳定性的铜基形状记忆合金,其相变温度可在-180400℃内可调,具有良好的高温应用潜力。利用铸造方法成形时容易引入杂质,且合金晶粒粗大、材料脆性严重。激光选区熔化(Selective Laser Melting,SLM)方法是金属增材制造工艺之一,它利用高能束激光逐点、逐层熔化微细金属粉
现代服务业是以新管理方式、新组织形式、新经营方式及高新技术为主要特征的知识密集型、技术密集型及信息密集型等服务企业。通过对"营改增"税收政策、所得税优惠政策及新兴
目的 观察尼卡地平和艾司洛尔联合应用预防双腔气管导管插管引起的心血管副反应。方法  6 0例患者随机分为对照组 (A组 )和联合用药组 (B组 ) ,每组 30例 ,患者均行双腔气