【摘 要】
:
在机器学习领域,弱学习定理指明只要能够寻找到比随机猜测略好的弱学习算法,则可以通过一定方式,构造出任意误差精度的强学习算法.基于该理论下最常用的方法有AdaBoost和Bagg
【基金项目】
:
中国科学院西部之光人才培养基金项目
论文部分内容阅读
在机器学习领域,弱学习定理指明只要能够寻找到比随机猜测略好的弱学习算法,则可以通过一定方式,构造出任意误差精度的强学习算法.基于该理论下最常用的方法有AdaBoost和Bagging.AdaBoost和Bagging的误差分析还不统一;AdaBoost使用的训练误差并不是真正的训练误差,而是基于样本权值的一种误差,是否合理需要解释;确保AdaBoost有效的条件也需要有直观的解释以便使用.在调整Bagging错误率并采取加权投票法后,对AdaBoost和Bagging的算法流程和误差分析进行了统一,在基于大数定理对弱学习定理进行解释与证明基础之上,对AdaBoost的有效性进行了分析.指出AdaBoost采取的样本权值调整策略其目的是确保正确分类样本分布的均匀性,其使用的训练误差与真正的训练误差概率是相等的,并指出了为确保AdaBoost的有效性在训练弱学习算法时需要遵循的原则,不仅对AdaBoost的有效性进行了解释,还为构造新集成学习算法提供了方法.还仿照AdaBoost对Bagging的训练集选取策略提出了一些建议.
其他文献
目的使用CT定量分析技术研究围手术期慢性硬膜下血肿(CSDH)变化与术后血肿复发的相关性。方法本研究纳入54例CSDH病例,共含血肿64个。研究围手术期多项典型CT指标与术后血肿复
本文在分析以往工程实例的基础上,分析了村镇道路的设计特点,对其在总体设计、平面线型设计、纵坡与道路排水设施等方面的设计优化提出了若干建议与处理意见,可供类似工程参
在激烈的市场竞争环境下,医院若想具备较强的竞争力,必须加强成本管理,建立更加合理、科学、具有可操作性的新的成本核算方法。本文介绍了作业成本法在医院成本管理中的应用,
随着社会的发展和经济的进步,人们对于教育事业的重视程度越来越高,其中英语已经成为目前人才的必备技能之一,作为一门国际化的语言工具,英语学习成为学生们日常学习的重点之
将[H+]为0.2~0.3 mol/L的萃取捞稀土废水用生石灰中和至pH为7.0后过滤,滤液用于稀土焙烧矿的浸出。通过实验来反映焙烧矿的浸出率、稀土REO收率以及水浸液产品质量等指标,并
随着社会经济的不断发展,在人们的物质需求获得越来越多的满足之后,原来不太被关注的环境问题日益凸显,逐渐进入人们日常的视野,成为人们不断深入关注的话题。为了解决人们面
随着信息技术与多媒体技术的发展,高校教学资源的建设既丰富又复杂,承载教学资源的平台也遍地开花,利用现有的平台和资源重构符合时代要求的优质教学资源,并进行有效的共享利
本文通过对图像教学课程的梳理,对图像化时代如何开展造型基础图像与媒介教学进行了探索,指出绘画艺术作为一种"有意味的形式"的视觉表达方式,反映的是艺术家对社会、生活、
盈余管理是20世纪80年代中后期兴起的一个重要课题,从那时起,对它的研究便一直活跃于资本市场和学术界。尤其是ST企业的盈余管理行为更是引起了人们的关注和重视。由于我国证
将规划理论引入到密码协议形式化分析领域,结合密码协议在实际网络环境中的运行特点和规律,提出了密码协议攻击规划理论;建立了一种对密码协议进行安全性验证的形式化模型,即