论文部分内容阅读
截至2020年,我国脱贫攻坚初步完成,消除了绝对贫困,但这并不意味着我国反贫事业终止,解决相对贫困仍是后扶贫时代的主要任务。相对贫困家庭最典型代表就是城镇和农村的的低保家庭,其家庭收入和生活水平虽然达到绝对贫困标准线,但和当地平均生活水平相比仍有很大差距。低保问题的治理有显著特点:首先,低保的标准是不断变化的,只要社会存在收入差距,低保群体将一直存在;其次,在涵盖人群和区域方面,除了脱贫人口,还包括城乡低收入者、进城农民工、受灾人群等;区域上不仅局限于脱贫的农村和偏远山区,还包括城市;最后,在致贫因素方面,导致家庭贫困的因素更多,包括地理环境、政策、经济环境、人口因素等,而且一个家庭通常受多种因素影响,帮扶成本更大。由此可见,城乡低保家庭帮扶治理仍是扶贫工作的重点。目前,国内低保家庭帮扶系统主要存在以下几个问题,一方面,帮扶工作主要围绕对低保家庭事后采取政策进行帮扶,在家庭成为低保家庭之后,相关部门才会采用相应政策及措施对其进行救助,而低保家庭的事前识别预警机制并不完善,难以在家庭落入低保之前及时干预,从而导致更多帮扶资源消耗;另一方面,在帮扶中常常采用一刀切的方式,帮扶措施个性化、精准化不够,不能充分挖掘低保家庭的相关影响因素与急需解决的问题,这可能造成低保家庭不能及时获得救助,或帮扶方向错误等现象,使得家庭困难状况日益严峻,为高效的帮扶救助工作带来巨大的挑战。针对这些问题,需要我们探索新的对城乡低保家庭事前预警模型,并挖掘致困因素,采取针对性措施进行帮扶。本文利用由辽宁省北票市民政局发起,对当地家庭进行各项指标的调查结果作为建模数据,首先通过降维模型进行对原始高维数据进行重要特征的筛选和提取,保留主要影响指标因素,剔除冗余变量;然后运用分类建模思想将以家庭为单位的群体进行分类,并挖掘不同类别家庭之间的潜在差异,再在不同家庭群体中分别进行建立低保家庭预警识别模型,从而实现将各家庭的潜在异质性考虑到预警识别建模中,并结合逻辑回归算法、XGBOOST算法进行模型的比较,分析模型的有效性和适用性,为低保家庭预警识别技术提供一种新的思路,最后通过关联规则算法挖掘高风险预警家庭的潜在致困因素,并提出帮扶建议。经过实证分析我们得到结论:第一,以K-means聚类分析为代表的基于分类建模思想的群体分类模型可以考虑到不同家庭间隐藏的异质性问题,并且在各类别中的家庭确实存在显著性差异,并结合分类建模思想,进一步增加了模型预测精度,提升了模型预测效果。第二,预警模型通过不同算法预测,得出非低保家庭落入低保的概率,在评估后发现并有较好的预测效果。通过预警模型评估非低保家庭转化为低保家庭的概率,得出容易导致城镇和农村家庭陷入低保的主要影响因素和高风险家庭的特征,导致城镇和农村家庭落入低保群体主要影响因素是人均年可支配收入较低、因病支出过多、劳动力数量不足等,其中城镇和农村家庭成员健康指标对家庭困难程度影响较大。农村家庭相比城镇家庭在劳动力数量不足和养老问题上更突出。第三,对高风险预警家庭用关联规则挖掘潜在相互关联的致困因素,发现了潜在致困特征之间关系。本文在以下几个方面实现了创新:第一,通过建立低保家庭预警识别模型,将之前帮扶工作的事后分析转化为事前分析,可以在家庭落入低保之前及时识别并采取措施干预;第二,本文采用群体分类的思想,解决了不同家庭之间存在的潜在差异问题,首先通过分类算法将各家庭进行分类,并挖掘不同类别家庭潜在异质性,对不同群体类别分别建模分析;第三、通过关联规则挖掘各高风险家庭潜在的致困因素,提出有针对性的帮扶建议。但也存在一些可优化空间:第一,本文仅针对辽宁省北票市的数据进行建模分析,模型结果会按照各地实际情况会存在一定的偏差,因此本文的实证研究仅提供一种方法借鉴;第二,在预测模型的选择上可以继续尝试更多的算法和特征选择、优化方法,通过多种模型对比,找出最适合当地数据的预警模型。