基于混合扰动的集成特征选择框架的设计与实现

来源 :温州大学 | 被引量 : 0次 | 上传用户:qqqqq721106
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在过去的十年中,集成较多的被应用在分类任务上,融合多个预测模型的集成方法往往有更好的分类性能。类似的集成思想最近也被应用到更具挑战的特征选择任务上。目前,基于集成的特征选择方法可以分为异质集成和同质集成两种。事实上,不管是异质集成还是同质集成,实现集成的扰动策略较为单一。因此,本文针对现有集成特征选择方法在该方面的不足,提出了基于混合扰动的集成特征选择框架。本文利用函数扰动和数据扰动设计了一种基于混合扰动的集成特征选择方法,旨在提升特征选择过程的稳定性和所选特征子集的分类准确率。首先利用Bootstrap重采样训练样本,生成不同扰动版本的训练数据集,增加样本多样性。然后利用多种特征选择算法构建集成组件,增加函数多样性。最后利用集成组件针对原始数据的不同扰动版本进行训练,根据聚合策略将所有特征选择结果组合成特征子集。为保证方法实现,本文设计了基于混合扰动的联合评估框架,并通过理论论证和实验评估证明方法的可行性。此外,本文通过相似性实验量化了集成实现对最终选择结果的真实影响,并通过不同集成配置对比实验探究集成组件、阈值和分类器对混合扰动集成特征选择方法的影响,旨在为集成方案的设计提出较为普适性的参考建议。综上所述,本文的主要工作是面向集成特征选择的一次尝试。实现了同时提升稳定性和预测性能的目的,并补充了有关集成配置方案的研究结论。希冀对今后更加全面有效的集成特征选择算法研究具有积极有效的意义。
其他文献
移动机器人在不断发展过程中所需要的技术在实时更新与提高,其中机器人定位所需的视觉SLAM技术研究也在不断深入,并且视觉SLAM中的闭环检测环节对于整体定位的准确性至关重要。但是,目前闭环检测方法依旧存在着一些问题,所以针对闭环检测中存在的问题做出改进,提出面向室内场景的一种SLAM闭环检测研究,主要研究内容与创新点如下:(1)对图像特征点的检测方法、描述方法和匹配方法进行了详细地介绍。首先,针对图
近年来,随着人工智能的发展,移动机器人在各领域得到广泛应用。定位问题是移动机器人研究的基本问题,是实现自主导航的前提,是机器人成功完成任务的基础。粒子滤波算法因其在非线性、非高斯系统中的适应性而受到学者们的广泛关注,基于粒子滤波算法的蒙特卡洛定位方法成功应用于移动机器人定位,但是存在一定缺陷。标准粒子滤波算法存在粒子退化、多样性缺失以及粒子数自适应问题。本文对标准粒子滤波算法进行改进并将其应用于移
物联网是继计算机、互联网和移动通信之后的信息技术革命,对新一轮产业变革和经济社会绿色、智能、可持续发展具有重要意义。蓝牙作为物联网感知层的一种无线通信协议,已经在
常见的高盐有机废水通常不仅含有高浓度的可溶性无机盐(SO_42-,Cl-,Ca2+,Na+等)、有机物、重金属和油类,还含有难以生物降解的各种有机物质。这种类型的废水不仅处理昂贵,而且难以处理。传统的处理方法有一些缺点或不足,例如,物理和化学方法不能有效降低废水中有机物的浓度,而生物方法中,微生物的生长受到高浓度盐的限制。因此,如何有效治理高浓度含盐有机废水的污染已成为人们关注的焦点。为了探索高盐
在我国经济快速发展时期,由于污水灌溉以及工业生产的影响,土壤重金属污染问题日益严重,对人类和动植物造成了极大的危害。耕地土壤重金属污染已成为人类关注的重大生态问题,土壤重金属污染监测是土壤治理的基础,具有重大的现实意义。高光谱遥感具有快速、原位、实时、宏观的监测特点,能够实现由点到面、由定性分析到定量分析的大面积原位监测,为土壤重金属污染监测提供一种新的技术手段。本文以雄安新区某区域为研究区,以全
贫困是全世界各个国家都面临的难题,如何消除贫困,如何减少相对贫困是当前全世界研究的课题。现阶段,我国的绝对贫困现象已较大程度的得到了改善和遏制,但相对贫困现象仍然存在。传统的区域性、粗放型扶贫政策对目前的相对贫困现象已经无法起到根本性的改善作用。党的十八大以来,中国的扶贫开发进入精准扶贫、精准脱贫的攻坚阶段,脱贫攻坚要求做到“六个精准”,切实提高精准扶贫的针对性、有效性、精准性。当前阶段,如何针对
基于实验数据为太阳能电池和光伏组件建立高精度模型对于光伏系统的仿真,评估,控制和优化至关重要。因此需要高效的算法来可靠地获取最佳参数以建立最优模型,基于种群的优化算法是目前被认为较为有前景的技术。在本论文中,分别对哈里斯鹰优化算法(Harris hawk optimization,HHO)、正余弦优化算法(Sine cosine algorithm,SCA)和鲸鱼优化算法(Whale optimi
本文主要参照了前人对中国江南私家园林及岭南园林的空间研究方法,通过利用空间句法对北方的皇家园林空间进行进一步的分析。选取具有皇家园林代表性的北京颐和园内部的东北角谐趣园(及其内部的霁清轩)空间组织进行讨论分析评价,旨在量化其空间结构,更深入了解其造园意图。具体利用Depthmap软件对谐趣园空间进行可视域量化分析,从人体可视性角度对现存空间得出图解进行横纵向统计比较分析,更深入的了解传统园林的空间
一直以来,农业在我国有着举足轻重的地位,近年来,随着经济的发展,农业在激烈的市场竞争中,为了更好的生存与发展,市场对农业企业的盈亏分析、成本管理与控制等方面也有着更高
露天煤矿由于端帮边坡及井田境界保护的需要,致使遗留大量的段帮煤炭资源不能充分回收,给露天煤矿的服务年限和生产带来较大的影响。端帮采煤机或掘锚一体机的使用和膏体充填技术的发展为露天煤矿端帮遗留煤炭资源的安全回收提供了技术条件并带来了新的发展机遇。由于露天煤矿埋深相对较浅,上覆岩层综合岩性相对较软,给露天煤矿端帮遗留膏体置换安全回采带来了一定的技术难题。本文以内蒙古神伊煤矿露天开采地质采矿条件为依托,