【摘 要】
:
在习近平总书记提出“精准扶贫”重要思想后,我国于2021年实现了脱贫攻坚战的全面胜利。当前,习总书记指出应做好脱贫攻坚成果的巩固工作,及时发现易返贫致贫人口并进行个性化帮扶。因此,利用家庭层面易准确获得的信息对农村贫困家庭进行精准识别并分析其致贫因素尤为重要。考虑到近年来我国贫困整体呈现出多因素协同致贫的特点,基于关联规则的分类算法(Classification Based on Associat
论文部分内容阅读
在习近平总书记提出“精准扶贫”重要思想后,我国于2021年实现了脱贫攻坚战的全面胜利。当前,习总书记指出应做好脱贫攻坚成果的巩固工作,及时发现易返贫致贫人口并进行个性化帮扶。因此,利用家庭层面易准确获得的信息对农村贫困家庭进行精准识别并分析其致贫因素尤为重要。考虑到近年来我国贫困整体呈现出多因素协同致贫的特点,基于关联规则的分类算法(Classification Based on Associations简称CBA算法)能够同时考虑多个特征的交互效应,因此本文引入CBA算法进行我国农村贫困家庭识别研究,并将该算法与集成学习分类模型进行融合以提升原始模型的泛化能力。本文基于CFPS2012-CFPS2018数据集进行实证研究。首先,本文对CBA算法与集成学习模型的泛化能力进行初步比较。在对关于我国贫困现状的研究进行梳理的基础上选择CBA算法对农村贫困家庭进行识别,并将CBA算法的泛化能力与各种传统集成学习模型进行对比分析,结果显示CBA算法对我国农村贫困家庭的识别能力较强,测试集的F1值为0.6861。之后本文将CBA算法与传统集成学习模型进行融合,并比较融合后集成学习模型的提升效果。融合后模型可克服集成学习模型的基学习器每次分支仅考虑一个变量的缺陷。模型融合步骤如下:首先,将CBA算法生成的用于分类的关联规则前项作为交互特征加入建模特征集合;其次,对特征进行筛选,包括特征初步筛选以及包裹式特征选择;最后,基于选择出的最优特征子集建立集成学习模型,分析各集成学习模型经模型融合后的提升效果。最终结果表明,本文选择出对于识别我国农村贫困家庭效果最好的模型为融合CBA算法的XGBoost模型,该模型在测试集上的F1值为0.7070,与原始XGBoost模型以及单纯CBA算法相比F1值分别提升了0.0907、0.0209。最后,本文基于SHAP可解释框架从宏观与微观层面对模型进行解释。对泛化能力最好的融合后XGBoost模型进行解释,分析部分重要特征如何影响模型输出;通过绘制个体贫困家庭的SHAP力图分析该家庭致贫原因,并探究个性化扶贫方案。本文最终所得分析结论较为合理。
其他文献
随着社会经济转型,土地用途冲突越来越明显,山区如何缓解土地利用冲突,实现农业强、农村美、农民富的目标,需要对山区土地进行适宜性评价并分区。贵州省是高原山地地区,典型的喀斯特地貌,山多平地少,正负地形交错,坝子作为人类生产生活的主要场所,是人类活动显著区域。随着新型城镇化、工业化、农业现代化及旅游产业化进程推进,坝子内部各类土地用途冲突日益尖锐。坝子是贵州省重要的粮食和农产品生产基地,也是农业产业化
根据《国际疾病分类(第十一次修订本)》(ICD-11)和《精神障碍诊断与统计手册(第5版)》(DSM-5),孤独症谱系障碍(Autism Spectrum Disorder,ASD)属于神经发育障碍,其核心表现为社会交往与沟通的质的缺陷和刻板、重复的行为特征,通常预后不佳而导致终身精神残疾。交互式语言即俗称的对话,是语言的一种类型,讲者对他人或自己的话语做出一个语言的反应。交互式语言是构成社会与学
在通信技术的迅猛发展和移动终端的广泛普及的同时,运用互联网思维引领政务服务向移动终端延伸成为“互联网+政务服务”深入发展的应有之义,建设移动政务也是优化政务服务、回应公众需求的必要举措。我国移动政务的建设也随着电子政务的持续拓展而加快推进的步伐,截至2021年6月,31个省级政府都已开通运营移动政务客户端,政务APP在省级政府层面的创新与传播是一个典型的政策扩散过程,但学界鲜少有人关注,关于移动政
随着通信设备和传感设备数量的激增,分布式机器学习技术被广泛应用在边缘计算、智慧城市、智能汽车等领域中。然而,分布式机器学习如分割学习等算法在实际应用中仍然存在诸多问题。首先,由于串行训练的特性,分割学习的训练时间随着参与者数量的增加而明显增加,这将导致无法把分割学习部署在成千上万台通信设备的大型应用场景中。其次,由于设备所在地区、时区的差异,不同边缘设备上数据的分布往往不同,而通过聚合这些设备上分
城市高密度发展、现代化进程加快使自然景观急速退化,剥夺了儿童与自然的接触机会,造成了城市儿童新的健康问题——“自然缺失症”(Nature-deficit Disorder)。对儿童而言,在生命的早期阶段接触自然不仅可以助益身体机能健康平衡,也可以使他们与周围的环境建立更紧密的联系,锻炼儿童感知生命的能力。由于儿童身体机能尚未发育成熟,其行动能力和活动范围存在一定局限性,“社区”就成为他们获得自然资
区块链是一种公开透明且抗篡改的分散式的公共数字账本技术,如今在虚拟货币、时间戳证明、证据保持等众多领域广泛使用。工作量证明共识算法作为最稳定、最被广泛应用的区块链共识算法,使以比特币为例的众多区块链应用的平均出块时间,在很长一段时间以来都成功地维持在设计值左右。但是由于近年来虚拟货币为首的区块链的应用日渐火爆,市场价值波动明显,越来越多的矿工加入了区块链的挖矿网络。矿工们的每一次加入或是退出操作都
“五育”融合历经了古代课程思想的沉淀、近代课程体系的完善以及现代课程制度的成型而萌生,符合国家发展的需要、体现了全面发展的教育理念和科学的课程育人观,代表了新时代中国基础教育改革的前沿方向。以课程设置为视角系统梳理“五育”历史发展脉络,以期对新时代基础教育课程改革提供借鉴与参考。
党的十八届三中全会正式拉开新一轮国企改革的序幕,十九大做出深化混合所有制改革是国企改革重要突破口的战略部署,“十四五”再次突出强调将混合所有制改革向纵深推进,不断做强做优做大国有资本。并购是企业优化资源配置和实现资本运作的重要方式,已然成为国企民企战略性重组和专业化整合、推动混合所有制改革的重要途径。基于化解过剩产能、助力民营企业度过难关、促进集成创新、整合优势资源等等动因,催化了我国近年大规模并
深度学习的发展为许多任务提供了出色的解决方案,随着神经网络应用的落地,人们对其安全性和鲁棒性也越发在意,但研究表明通过往原始数据中添加扰动生成的对抗样本足以误导模型的输出。对抗样本研究可以加强对神经网络的认识,也能推动网络的防御和改进。因此探索攻击力更强的对抗样本,开拓新的对抗攻击方式是很有研究价值的。本文工作主要围绕着深度学习的对抗样本进行,贡献如下:1.基于生成对抗网络,提出了特征扰动的对抗样
自2017年以来我国可转债市场在政策鼓励下蓬勃发展,尤其在近两年里市场扩张迅速,可转债现有数量及发行规模均突破新高,可转债作为备受关注的金融衍生产品之一,其定价是否合理将对整个行业的发展及完善产生影响。我国可转债市场在2021年下半年涨势明显,其中,有色金属行业作为典型的顺周期板块,与可转债市场大盘走势契合,该行业可转债虽在存量和数量上都处于中间水平,但在此波上涨趋势中发挥了重要的推动作用,并以1