论文部分内容阅读
摘 要:该文提出了一种基于统计回归方法研究课后作业量的影响因素以及如何帮助老师更加合理的布置课后作业的方案,找出其影响课后作业量的因素,对其建立线性回归模型,对于各种无法量化的定性的因素,采用了定性变量的数量化方法进行分析,通过软件进行拟合优度检验、方程的显著性检验(F-检验)、变量的显著性检验(t-检验)、逐步回归分析、拉格朗日检验、异方差检验等后,选取与被解释变量有关的因素,加以统计分析得出最后结果。
关键词:作业量;学生掌握程度;回归分析;定性变量的量化;最优解
一、具体问题及分析
线性代数课程作业量的影响因素有很多,如:老师授课的多少,学生的课余时间,其余课程的作业量等,我们需找出作业量与影响因素之间的关系。因为影响因素较多,我们决定采用回归分析的方法进行研究,这就需要大量数据,我们决定通过向学生进行问卷调查的形式采取抽样调查的方法获取数据。其中,作业量通过学生完成作业时间来衡量,若以题数衡量,由于每题的难易程度不同,难以标准化。在获取数据后利用 EViews 系统软件对所取得数据结果进行分析,并采用拟合优度检验、方程的显著性检验(F-检验)、变量的显著性检验(t-检验)、逐步回归分析、拉格朗日检验、异方差检验,用以评判所取因素对课后作业量的差异性,从而判断结果的可信性。
二、模型的假设
1.t-检验
t-检验是用 t 分布理论来预测差异发生的概率,从而得出变量因素是否显著。
当总体分布是正态分布,那么样本平均数与总体平均数的离差统计量呈 t 分布。检验统计量为:其中,t 为样本平均数与总体平均数的离差统计量,为样本平均数,μ为总体平均数,为样本标准差,n 为样本容量。
2.White 检验思想
在异方差形式未知的情况下,假设当模型中包括了 3 个自变量,形如:
其中为方程 的残差值,此时 White 检验就是上述回归的整体显著性的 F 检验,如果此时 F 檢验显著,那么就存在异方差,反之则不存在异方差。但是当自变量增多的时候,上述回归中的自变量将呈现出几何级增加,因此将大量损失自由度。因此存在的一个改进为,作回归:
此时采用 F 检验来检验的原假设即可。
三、模型的建立与求解
我们考虑影响线性代数课程的因素,因而我们根据实际学习状况,从学生、教师的角度客观的考察影响因素,并对所收集到的数据进行统计分析,从而确定影响作业量的因素。从实际学习生活中,我们知道对课后作业量的布置影响主要来自学生和教师两个方面,在满足假设前提的基础上,得出听讲程度、学生接受程度、教师授课水平、作业难易度、作业题目数量、其余课程的数量、其余作业所需时间的影响因素。将作业量看成被解释变量,以上其中因素看成解释变量,对所建立方程进行回归分析。
通过分析可以得出学生听课程度、教师授课水平和其余作业所需时间和作业量成正比例关系,作业难易度与作业量成反比例关系,这就要求教师在实际授课过程中考虑学生的听课程度,对于学生认真听课的情况要给予适当多的作业量,从而达到复习巩固更好掌握知识;授课水平较高的教师因为能给出较高的教学质量,因此可能会多布置作业;回归结果显示的其余作业所需时间与作业量成正比例关系是超出一般理解的,因此这就建议教师了解学生所有课程的作业时间,通过合理安排线性代数作业的时间来达到让学生学习达到最大效益。
四、结论检验
影响作业量的因素有学生听课程度、教师授课水平、作业难易度、其余作业所需时间。结合实际可以得出学生听课程度、教师授课水平和其余作业所需时间和作业量成正比例关系,作业难易度与作业量成反比例关系。检验过程中采用了逐步回归分析,逐步回归分析发现方程拟合优度不高并且存在异方差,因此采用WHITE检验异方差,用WLS(最小二乘法)对方程修正异方差,在使用1/resid的权重后发结果没有很理想,因此采用1/resid^2的权重,得出可决系数为0.999952,并且方程能通过t-检验、F-检验、拟合优度检验,模型建立合理。当老师每节课布置 1 小时的作业量时,学生掌握程度可达到最大为 6.36,即掌握程度为 63.6%。
五、模型的评价与推广
1.模型的优点
(1)用经济学问题类比所需解决的问题,将学生对知识的掌握程度类比成经济学中的收益,通过对各种因素的考察、分析得出模型所需要的变量(2)模型中对难以量化的变量采用了性变量的数量化方法进行分析,从而将变量数据化方便统计分析;(3)统计分析、回归分析等方法成熟,计算可靠,结果直观可信;
2.模型的缺点
(1)样本数据有限,代表性不强;(2)假设条件较为理想,实际难以达到这样的理想水平;(3)各量化指标对学生掌握程度的影响使得非线性因素增加,导致问题变复杂,产生误差;(4)模型处理时虽然形式简单,便于计算,而且也选取了真实可靠的数据,但是学生学习问题并不具有普遍性,此模型得出的结论只能反映学生对知识掌握程度与作业量的大致关系。
3.优化
在模型的优化与处理软件选择部分,如果有更加充足的数据,可以通过使用 Matlab、SPSS 软件对作业量情况进行进一步线性回归分析,而不是像本文中对于模型的结论与求解大多是通过对于简单经济学软件 EViews 分析得来。
参考文献
[1]高正晖.线性代数[M].北京:中国科学技术出版,2009.
[2]刘大成.定性变量的数量化方法新探[M].黑龙江:东北林业大学.2011
[3]张昊.加权最小二乘法与 AR 组合模型在预测中的应用研究.长沙:中南大学.2011.
关键词:作业量;学生掌握程度;回归分析;定性变量的量化;最优解
一、具体问题及分析
线性代数课程作业量的影响因素有很多,如:老师授课的多少,学生的课余时间,其余课程的作业量等,我们需找出作业量与影响因素之间的关系。因为影响因素较多,我们决定采用回归分析的方法进行研究,这就需要大量数据,我们决定通过向学生进行问卷调查的形式采取抽样调查的方法获取数据。其中,作业量通过学生完成作业时间来衡量,若以题数衡量,由于每题的难易程度不同,难以标准化。在获取数据后利用 EViews 系统软件对所取得数据结果进行分析,并采用拟合优度检验、方程的显著性检验(F-检验)、变量的显著性检验(t-检验)、逐步回归分析、拉格朗日检验、异方差检验,用以评判所取因素对课后作业量的差异性,从而判断结果的可信性。
二、模型的假设
1.t-检验
t-检验是用 t 分布理论来预测差异发生的概率,从而得出变量因素是否显著。
当总体分布是正态分布,那么样本平均数与总体平均数的离差统计量呈 t 分布。检验统计量为:其中,t 为样本平均数与总体平均数的离差统计量,为样本平均数,μ为总体平均数,为样本标准差,n 为样本容量。
2.White 检验思想
在异方差形式未知的情况下,假设当模型中包括了 3 个自变量,形如:
其中为方程 的残差值,此时 White 检验就是上述回归的整体显著性的 F 检验,如果此时 F 檢验显著,那么就存在异方差,反之则不存在异方差。但是当自变量增多的时候,上述回归中的自变量将呈现出几何级增加,因此将大量损失自由度。因此存在的一个改进为,作回归:
此时采用 F 检验来检验的原假设即可。
三、模型的建立与求解
我们考虑影响线性代数课程的因素,因而我们根据实际学习状况,从学生、教师的角度客观的考察影响因素,并对所收集到的数据进行统计分析,从而确定影响作业量的因素。从实际学习生活中,我们知道对课后作业量的布置影响主要来自学生和教师两个方面,在满足假设前提的基础上,得出听讲程度、学生接受程度、教师授课水平、作业难易度、作业题目数量、其余课程的数量、其余作业所需时间的影响因素。将作业量看成被解释变量,以上其中因素看成解释变量,对所建立方程进行回归分析。
通过分析可以得出学生听课程度、教师授课水平和其余作业所需时间和作业量成正比例关系,作业难易度与作业量成反比例关系,这就要求教师在实际授课过程中考虑学生的听课程度,对于学生认真听课的情况要给予适当多的作业量,从而达到复习巩固更好掌握知识;授课水平较高的教师因为能给出较高的教学质量,因此可能会多布置作业;回归结果显示的其余作业所需时间与作业量成正比例关系是超出一般理解的,因此这就建议教师了解学生所有课程的作业时间,通过合理安排线性代数作业的时间来达到让学生学习达到最大效益。
四、结论检验
影响作业量的因素有学生听课程度、教师授课水平、作业难易度、其余作业所需时间。结合实际可以得出学生听课程度、教师授课水平和其余作业所需时间和作业量成正比例关系,作业难易度与作业量成反比例关系。检验过程中采用了逐步回归分析,逐步回归分析发现方程拟合优度不高并且存在异方差,因此采用WHITE检验异方差,用WLS(最小二乘法)对方程修正异方差,在使用1/resid的权重后发结果没有很理想,因此采用1/resid^2的权重,得出可决系数为0.999952,并且方程能通过t-检验、F-检验、拟合优度检验,模型建立合理。当老师每节课布置 1 小时的作业量时,学生掌握程度可达到最大为 6.36,即掌握程度为 63.6%。
五、模型的评价与推广
1.模型的优点
(1)用经济学问题类比所需解决的问题,将学生对知识的掌握程度类比成经济学中的收益,通过对各种因素的考察、分析得出模型所需要的变量(2)模型中对难以量化的变量采用了性变量的数量化方法进行分析,从而将变量数据化方便统计分析;(3)统计分析、回归分析等方法成熟,计算可靠,结果直观可信;
2.模型的缺点
(1)样本数据有限,代表性不强;(2)假设条件较为理想,实际难以达到这样的理想水平;(3)各量化指标对学生掌握程度的影响使得非线性因素增加,导致问题变复杂,产生误差;(4)模型处理时虽然形式简单,便于计算,而且也选取了真实可靠的数据,但是学生学习问题并不具有普遍性,此模型得出的结论只能反映学生对知识掌握程度与作业量的大致关系。
3.优化
在模型的优化与处理软件选择部分,如果有更加充足的数据,可以通过使用 Matlab、SPSS 软件对作业量情况进行进一步线性回归分析,而不是像本文中对于模型的结论与求解大多是通过对于简单经济学软件 EViews 分析得来。
参考文献
[1]高正晖.线性代数[M].北京:中国科学技术出版,2009.
[2]刘大成.定性变量的数量化方法新探[M].黑龙江:东北林业大学.2011
[3]张昊.加权最小二乘法与 AR 组合模型在预测中的应用研究.长沙:中南大学.2011.