论文部分内容阅读
精准扶贫是世界难题,也是社会治理的重要内容之一。目前国内关于社会学角度的精准扶贫理论研究已十分成熟,在“互联网+精准扶贫”信息化扶贫模式的应用上也取得初步成果;然而利用信息化手段对扶贫问题内在机理进行深入探索的工作开展不够。对贫困户致贫与脱贫的深层次规律进行定量分析研究一方面有助于提高扶贫效率从根本上消除贫困,另一方面对研究社会发展及政策制定起到一定参考作用,为国际扶贫工作的开展提供新方向。为提升扶贫工作中资源调配精准率及帮扶效率,对扶贫工作中的潜在规律进行定量拟合,本文在扶贫数据驱动下对精准脱贫智能分析进行了相关研究,主要内容包括脱贫时间预测以及帮扶措施实施规则归纳。为提高帮扶计划受众人群的匹配度及扶贫资源分配的准确性,提出利用机器学习中的规则学习对帮扶措施实施规则进行归纳,并选择规则学习中较为经典的Repeated Incremental Pruning to Produce Error Reduction(RIPPER)算法进行模型构建。本文以教育资助政策中各等级助学金贷款发放规则归纳为例,进行验证实验说明。第一部分实验中,在20000条数据基础上,RIPPER与C4.5,PART决策树三者进行对照实验,得到由三者生成的规则集分别为R1,R2,R3。试验结果表明:从整体上看,R1规则集覆盖准确率比R2与R3分别高出0.11、0.16;从局部上看R1中任意两类规则的召回率比的最大值为1.078,低于R2的1.25与R3的1.34。在第二部分实验中改变实验数据集大小,使训练集中三类数据量保持均衡,结果表明形成的R1、R2、R3规则集中任两类规则召回率比的最大值均低于第一部分实验。上述结果表明RIPPER规则学习算法相比C4.5、PART决策树在帮扶措施实施规则集覆盖准确率及对类别不均衡数据的适应性上更强,同时也证明了本文提出的利用RIPPER规则学习算法对帮扶措施实施规则进行归纳的方案是可行有效的。针对精准扶贫缺乏有效的分析模型对扶贫成效与脱贫时间进行准确刻画与定量分析的问题,提出了基于优化FOA-BPNN贫困户脱贫时间预测模型。为了改善BP神经网络模型可能陷入局部最小的缺陷,引入果蝇优化算法,以BP神经网络的预测误差作为适应度值,寻找最优的BP神经网络初始参数值提高参数精度。同时,由于标准果蝇优化算法的搜索半径固定,可能导致后期局部寻优性能弱,提出了一种动态步长变更策略的DSFOA-BPNN模型,通过引入变速因子与种群密度,将动态步长FOA算法与传统误差反向传播神经网络(BPNN)结合,提高模型预测脱贫时间准确率。在湖北省某贫困地区50000条扶贫数据的基础上,通过实验表明,与BPNN和FOA-BPNN模型相比,提出的DSFOA-BPNN模型预测准确率分别高出0.18和0.08。增量实验表明,提出的DSFOA-BPNN模型在脱贫时间预测准确率上更具有适应性。