论文部分内容阅读
【摘 要】 目前,我国高校大都已经建立了较为全面的贫困大学生资助体系,国家“奖、贷、助、勤、补、减、免”等资助政策体系的逐步完善,保障了贫困生的求学之路。但是由于学生的贫困生申请信息偏于主观、贫困指标难以量化等因素,使得贫困生认定工作仍然是高校资助决策中的难点问题。因此,寻求一种客观、高效的贫困生认定评估标准,成为高校资助工作研究的重要内容。本文从收入-支出的高相关性入手,选择学生的校园消费数据作为学生贫困情况的表征,计算了学生的贫困指数并建立了贫困生认定的回归模型,之后对学生的消费数据做了聚类分析。最后,本文给出了一个确定的助学金发放标准,作为该校学工部门贫困生评估、资助与监控的有力辅助工具。
【关键词】 高校贫困生 校园消费数据 回归分析 贫困指数
一、背景及研究意义
目前,我国高校都已经建立了较为全面的贫困大学生资助体系,助学金的评定与发放涉及广大学生的切身利益,备受各界关注。而现如今的“校园一卡通”是“数字化”校园的重要组成部分,其具有在食堂、超市、浴池、校车等各类收费应用等场所的脱机消费功能。本文通过对燕山大学部分学生的一卡通消费流水数据进行消费行为分析,并提出了相关的策略建议,发挥了校园卡基础数据的应用价值,从而为该校助学金的评定提供更好的依据。这也对进一步利用校园卡数据进行数据分析与辅助决策有着一定的指导意义。
二、数据处理及统计分析
2.1 数据结构及数据预处理
本文的研究对象是燕山大学的本科生,研究数据由两部分组成:一是来自燕山大学“校园一卡通平台”部分同学的消费数据;另一部分是通过燕山大学学生工作处提供的部分获得助学金的学生名单进而从校园一卡通部门得到的这部分学生的消费流水数据。学生消费流水数据包括在多个校区的食堂消费、超市消费、乘坐校车消费、转账以及學生校园卡密码修改、校园卡挂失等多种信息,较杂乱,所以需要对数据进行适当的处理及汇总。汇总后的最终数据由卡号、转帐金额、消费总次数、有效交易天数、总消费金额、超市消费金额、超市消费次数、食堂消费金额、食堂消费次数、浴池消费金额、浴池消费次数以及校车消费金额几部分构成。
2.2 贫困指数模型
本节建立了一个可以直观反映学生贫困程度的贫困指数模型,也可以称之为贫困指数算法。
一般来讲认为贫困生具备以下几个条件:
(1)贫困生消费总金额相对较少;
(2)贫困生次均消费金额较少;
(3)贫困生日均消费金额比较少而且日均消费频率稳定;
(4)贫困生食堂消费比重大,超市消费比重小;
(5)贫困生食堂刷卡次数多,超市刷卡次数少
根据以上五点,可以总结出:
(1)消费次数必须达到必要消费次数;
(2)困指数和消费次数呈正相关,和消费总金额、日均消费金额和次均消费金额呈负相关。根据总结,我们提出了如下贫困指数计算公式
(2-1)
其中,表示学生的贫困指数,表示全部学生的平均消费次数,表示全部学生的平均消费金额。表示必要消费次数控制因子,表示贫困生消费总金额控制因子。这两个因子分别用于保证贫困生必须在必要消费次数以上和贫困生的总消费金额在平均消费水平的多少以内。
由贫困指数的定义可以看到贫困指数越大学生越贫困,反之则越不贫困。根据前人的经验,本文中的和均取0.2。
依据贫困指数的大小,我们来判定助学金的发放与否以及发放等级。继续利用此模型来计算第二部分数据的贫困指数来用于下一节的分析。对于这部分数据,我们区别性别进行计算,并剔除消费总次数小于60的无效数据,最终得到的可用数据为41组。我们利用这41组数据进行下一节的线性回归分析。
2.3 线性回归模型
上一节中文章利用学生消费次数和消费金额计算了贫困指数。这一节将进行更加深入的研究。本节回归中的自变量选取为转帐金额、有效交易天数、超市消费金额、超市消费次数、食堂消费金额以及食堂消费次数。
2.4 聚类分析
我们来对前面剔除数据之后所得到的41组数据分析一下第二部分数据。对于这部分数据,我们区别性别进行分析,并剔除消费总次数小于60的无效数据,最终得到的可用数据为41组。利用SAS软件对本文的汇总数据进行聚类分析。
程序运行部分结果见图2-1。
对比以上聚类结果和前面计算的贫困指数发现,被分在一类的学生其贫困指数也十分接近。这也相互验证了我们前面分析的正确性。下面再第一对部分中女生的数据做聚类分析。聚类见表2-1和图2-2。
从上述结果看出当分类结果为四类时,分类效果最好,这与我校现行的规则相一致,说明学校将学生按照不同的贫困程度分为四个等级是合理的。接着根据贫困指数与聚类分析的结果给出助学金发放的如下标准:
三、结论
本文研究的是助学金发放与校园一卡通消费数据之间的关系,首先进行的是数据的收集。接着对部分学生的消费流水进行了分类汇总处理。经过初步对超市、食堂消费比重的分析,暴露出了我校助学金发放制度可能存在着某些缺陷,其公平合理性还有进一步提升的可能。随后本文又计算了各学生的贫困指数并对学生的消费数据进行了聚类分析。贫困指数与聚类分析结果的吻合为我们今后的助学金的发放提供了一个新的思路,研究表明,聚类结果一般是四类最佳,并且聚类在一起的学生其贫困指数也是非常接近的。所以,可以充分利用贫困指数划定其标准来使助学金发放更加公平合理。线性回归分析中所涉及到的变量增多,使得对学生贫困的预测结果更加准确。当然,为了进一步验证本文模型的准确程度与其可用性,本文的后序工作需要对部分学生进行追踪调查,看其真实情况与本文通过其一卡通的消费数据分析得到的该生的贫困程度是否一致。
【关键词】 高校贫困生 校园消费数据 回归分析 贫困指数
一、背景及研究意义
目前,我国高校都已经建立了较为全面的贫困大学生资助体系,助学金的评定与发放涉及广大学生的切身利益,备受各界关注。而现如今的“校园一卡通”是“数字化”校园的重要组成部分,其具有在食堂、超市、浴池、校车等各类收费应用等场所的脱机消费功能。本文通过对燕山大学部分学生的一卡通消费流水数据进行消费行为分析,并提出了相关的策略建议,发挥了校园卡基础数据的应用价值,从而为该校助学金的评定提供更好的依据。这也对进一步利用校园卡数据进行数据分析与辅助决策有着一定的指导意义。
二、数据处理及统计分析
2.1 数据结构及数据预处理
本文的研究对象是燕山大学的本科生,研究数据由两部分组成:一是来自燕山大学“校园一卡通平台”部分同学的消费数据;另一部分是通过燕山大学学生工作处提供的部分获得助学金的学生名单进而从校园一卡通部门得到的这部分学生的消费流水数据。学生消费流水数据包括在多个校区的食堂消费、超市消费、乘坐校车消费、转账以及學生校园卡密码修改、校园卡挂失等多种信息,较杂乱,所以需要对数据进行适当的处理及汇总。汇总后的最终数据由卡号、转帐金额、消费总次数、有效交易天数、总消费金额、超市消费金额、超市消费次数、食堂消费金额、食堂消费次数、浴池消费金额、浴池消费次数以及校车消费金额几部分构成。
2.2 贫困指数模型
本节建立了一个可以直观反映学生贫困程度的贫困指数模型,也可以称之为贫困指数算法。
一般来讲认为贫困生具备以下几个条件:
(1)贫困生消费总金额相对较少;
(2)贫困生次均消费金额较少;
(3)贫困生日均消费金额比较少而且日均消费频率稳定;
(4)贫困生食堂消费比重大,超市消费比重小;
(5)贫困生食堂刷卡次数多,超市刷卡次数少
根据以上五点,可以总结出:
(1)消费次数必须达到必要消费次数;
(2)困指数和消费次数呈正相关,和消费总金额、日均消费金额和次均消费金额呈负相关。根据总结,我们提出了如下贫困指数计算公式
(2-1)
其中,表示学生的贫困指数,表示全部学生的平均消费次数,表示全部学生的平均消费金额。表示必要消费次数控制因子,表示贫困生消费总金额控制因子。这两个因子分别用于保证贫困生必须在必要消费次数以上和贫困生的总消费金额在平均消费水平的多少以内。
由贫困指数的定义可以看到贫困指数越大学生越贫困,反之则越不贫困。根据前人的经验,本文中的和均取0.2。
依据贫困指数的大小,我们来判定助学金的发放与否以及发放等级。继续利用此模型来计算第二部分数据的贫困指数来用于下一节的分析。对于这部分数据,我们区别性别进行计算,并剔除消费总次数小于60的无效数据,最终得到的可用数据为41组。我们利用这41组数据进行下一节的线性回归分析。
2.3 线性回归模型
上一节中文章利用学生消费次数和消费金额计算了贫困指数。这一节将进行更加深入的研究。本节回归中的自变量选取为转帐金额、有效交易天数、超市消费金额、超市消费次数、食堂消费金额以及食堂消费次数。
2.4 聚类分析
我们来对前面剔除数据之后所得到的41组数据分析一下第二部分数据。对于这部分数据,我们区别性别进行分析,并剔除消费总次数小于60的无效数据,最终得到的可用数据为41组。利用SAS软件对本文的汇总数据进行聚类分析。
程序运行部分结果见图2-1。
对比以上聚类结果和前面计算的贫困指数发现,被分在一类的学生其贫困指数也十分接近。这也相互验证了我们前面分析的正确性。下面再第一对部分中女生的数据做聚类分析。聚类见表2-1和图2-2。
从上述结果看出当分类结果为四类时,分类效果最好,这与我校现行的规则相一致,说明学校将学生按照不同的贫困程度分为四个等级是合理的。接着根据贫困指数与聚类分析的结果给出助学金发放的如下标准:
三、结论
本文研究的是助学金发放与校园一卡通消费数据之间的关系,首先进行的是数据的收集。接着对部分学生的消费流水进行了分类汇总处理。经过初步对超市、食堂消费比重的分析,暴露出了我校助学金发放制度可能存在着某些缺陷,其公平合理性还有进一步提升的可能。随后本文又计算了各学生的贫困指数并对学生的消费数据进行了聚类分析。贫困指数与聚类分析结果的吻合为我们今后的助学金的发放提供了一个新的思路,研究表明,聚类结果一般是四类最佳,并且聚类在一起的学生其贫困指数也是非常接近的。所以,可以充分利用贫困指数划定其标准来使助学金发放更加公平合理。线性回归分析中所涉及到的变量增多,使得对学生贫困的预测结果更加准确。当然,为了进一步验证本文模型的准确程度与其可用性,本文的后序工作需要对部分学生进行追踪调查,看其真实情况与本文通过其一卡通的消费数据分析得到的该生的贫困程度是否一致。