Boosting模式识别预测方法的抗噪性研究

来源 :重庆大学 | 被引量 : 0次 | 上传用户:shengli1011
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
提升(Boosting)方法是一种新兴的数据挖掘方法,近些年在模式识别领域受到广泛关注。它的基本思想是集成多个简单且性能一般的弱学习算法,最终形成具有高准确度的估计。在分类问题下,Boosting方法通过对多个基分类器的有效整合,生成预测性能更好的集成分类器。AdaBoost算法是提升算法中的代表性算法,在近年来取得很大成功,它能有效降低集成分类器的预测误差。尽管如此,很多实验发现AdaBoost算法对噪音数据非常敏感。当训练集中出现不容忽视的类别噪音或异常数据时,AdaBoost算法对弱学习算法的提升作用将受到很大制约。在模式识别中,噪音过滤和嫌疑样本修正两种数据预处理方法常用于提高含噪音训练集的数据质量。这两种方式大都建立在专家意见或数据的粗糙认识基础上,难免出现决策风险。噪音过滤手段可能会牺牲正常样本,减小可用样本容量,造成信息损失,而修正嫌疑样本则可能使训练集增加新的数据噪音。目前国内外文献对AdaBoost算法在抗噪性方面的改进主要从损失函数,权重更新机制和基分类器的组合方式等方向做针对性改进。有的改进思路主要改良算法原理,提高算法的鲁棒性,而另一些则融入数据预处理手法,提出很多基于样本数据的改进AdaBoost算法。当前在提高AdaBoost算法的抗噪性方面,很少运用置信度思想表达训练样本的嫌疑大小,但置信度方法可避免对嫌疑样本的硬性删除或修正,还能充分体现决策者对样本可靠性预判的把握程度,因此携带很多有价值的信息。在一些模式识别方法中出现的置信度思想主要用于样本的加权或表达预测的把握度。论文基于样本类别的置信度信息,改进提升算法的目标函数,提出一套二分类问题下基于置信度的改进Boosting算法,为提高Boosting算法的抗噪性提供新的思路。论文还分析了改进Boosting算法的鲁棒性,并与当前文献中出现的多种提升算法进行比较,分析它们相互间的联系以及本文改进算法的突出特点。最后利用实验验证改进Boosting算法的有效性。结果表明,改进算法在人工模拟数据和UCI实际数据集上均具有良好的鲁棒性,显示出在提高Boosting算法抗噪性方面的很大潜力。
其他文献
危机管理理论自20世纪90年代初引入我国以来,通过与我国企业的市场营销实际相结合,得到了长足的发展。营销危机的发生,不但给企业带来价值损失,还对企业品牌、信誉等无形资产
针对自主研制的CL102型凿岩台车展开稳定性研究,提出基于稳定角的凿岩台车稳定性评估方法,根据空间几何理论实现了凿岩台车稳定角解析解的推导,并给出了评估限值。针对CL102
随着高等院校后勤社会化改革的不断发展,学生公寓用电管理已逐步采用付费方式,急需一种新的电能集中计量、管理、控制系统。目前,电能集中管理控制系统还处于发展初期,仍存在
发展是人类社会永恒的主题。可持续发展作为一种新的更加符合社会发展规律的发展观已经渗透到人类生活的各个领域。金融可持续发展就是可持续发展观与金融发展的融合。可以说
竞技体操是竞技运动中的一个“拳头”项目,是奥运战略的重要内容。百余年的奥运史见证了世界竞技体育水平的不断发展,我国的传统优势项目更是处在发展的第一线,没有进步就意
通过对MR定位原理、算法实现分析,并利用业内成熟软件与实际DT&CQT测试数据进行对比,充分验证了MR数据能够真实反映城区路面网络覆盖情况,可以用于相对宽阔无线环境的网络规
目的探讨小儿电动牙刷在口鼻气管插管患者口腔护理中的应用方法和效果。方法 2009年8月~2010年4月,选择在本科室住院的经口鼻气管插管患者53例为研究组,采用小儿电动牙刷结合
当前教师效能研究内涵的界定呈现多元化格局,教师效能研究经历了范式的转变,其评价方式多样,但均各有优势与局限,对于教师效能的研究还主要集中在课堂范围内教师教学效能的研
在分析研究导弹武器特装车辆特点的基础上,结合部队驾驶员驾驶操作训练过程中存在的问题,研制了导弹武器特装车辆辅助驾驶与监控考核系统,详细介绍了该系统硬件各功能模块的设计
物证技术是对案件中可能成为物证的物质、物品、文书和痕迹进行发现、识别、记录、提取和鉴定的各种科学技术的原理、手段和方法的总称。包括物证摄影技术、痕迹检验技术、笔