论文部分内容阅读
作为制约经济社会发展的主要因素,贫困问题一直受到了世界各国高度重视。我国从提出“精准扶贫”思想,到扶贫开发“贵在精准,重在精准,成败之举在于精准”的贯彻落实,“精准扶贫”已经上升为我国重要的战略任务。扶贫既是“扶志”也是“扶智”,高校作为我国社会主义建设人才培养的重要基地,如何克服“大水漫灌”的扶贫方式,实现精准帮扶便成了高校管理者面临的重要课题。基于此,研究结合了数据挖掘方法,探究了精准评价高校贫困学生主要因素,构建了精准分类决策树模型,以期为高校资助者实施精准帮扶工作提出可行的对策建议。 本次研究首先梳理了国内外贫困学生认定和数据挖掘相关理论研究。其次,以贵州省“建档立卡”贫困户学生数据和贵州学生学籍数据为主线,比对、筛选出贵州高校“建档立卡”贫困户学生数据。同时,采用数据挖掘Apriori关联算法和DT(决策树)算法提取出贫困学生主要特征,并将其特征重组为新的属性,实现对原始指标的降维。最后,将降维后的数据随机抽取70%作为训练集,构建高校贫困学生精准分类决策树模型,并用剩下30%数据作为测试集对模型进行验证。 研究共提取出由家庭人均纯收入小于2300元、学生申请助学贷款、家庭人口数10人以上、户主文化程度是小学和初中、生源地未脱贫以及果园面积小于0.39亩等12个评价指标组成的7个主要特征。构建了以家庭人均纯收入小于2300元且学生申请助学贷款为第一大分支要素的贵州贫困学生分类决策树,对其分类效果进行验证。结果表明:总体预测的准确率为84.5%,分类效果较好。基于上述构建的贫困学生分类决策树,为不同贫困程度学生提供“扶智”和“扶志”两个方面的帮扶对策建议。以促进贵州高校资助工作者实现对贫困学生的精准帮扶。