论文部分内容阅读
教学过程中,对测试结果进行分析是为了服务于教学,提高教学质量。对学生测试结果的分析,不仅要关注学生在不同项目上的整体作答情况,而且要关注学生在不同题型、不同知识点、不同能力层次上的作答情况,为教师改进教学提供实际的依据。本文以两个班(共计113个样本)的成绩数据为例,分别从数据准备、数据分析两个方面来介绍如何运用SPSS软件(SPSS 13.0汉化版为例)对教学测试结果进行统计分析。
一、数据准备
1.建立测试的双向细目表,并根据双向细目表编拟试题
双向细目表是试题结构的直接体现,是确保试题符合测试目的和测量结构的有力保障。命题者根据课程标准、测试内容、测试的性质与功能和学科测量结构,一般以知识内容为纵轴,以能力水平、题型、难度值、分数为横轴建立。例如,我们在构建初中化学测试的双向细目表时,依据课程标准将内容分为“科学探究、身边的化学物质、物质构成的奥秘、物质的化学变化、化学与社会发展”五个内容主题。能力水平按层次分为“事实性记忆、概念的理解、规律的运用和问题的解决”,每个水平层次又再进行细分。试题的命制必须依据双向细目表的具体要求来编制。
2.对试题的难度进行预测
难度即项目的难易程度。难度值一般用全体受测者在该项目上的平均分除以该项目的满分得到。难度预测就是拟题人根据学生的学情对学生测试成绩的一种理性估计。试题的编拟者依据双向细目表对整个试卷及每个知识点的难度值都要进行客观的预测,以便和测试结果所获得的实际难度进行对照分析,为评估试题质量和学生成绩提供依据。綜合试卷难度预测结果为0.72(如下表所示)。
3.学生成绩统计
一般以试题的题号顺序为序在Excel中对每个知识点建立统计项目,再进行数据统计,也可以直接在SPSS中进行统计。
二、数据分析
1.试题的命制质量分析
(1)试题的难度分析
进行试卷难度分析是为了从整体上检测学生成绩是否达到拟题者的预设值,从而粗略地判断试题的命制质量。实际难度值高于预测难度值,说明试题偏易;实际难度值低于预测难度值,说明试题偏难。执行“分析(A)——描述统计(E)——描述统计分析(D)”,选择“总分”进入“变量”栏进行分析,可获得下列报表。
输出结果显示出总分变量的样本数、最高分、最低分、平均分和标准差(学生成绩的波动大小)五个常用的统计量。抽样对象的平均分为75.6分,可以看出该试卷的整体难度值约为0.76(卷面满分为100分),略高于出题者的预测难度0.72。原因可能是试题略简单,也可能是抽样的对象整体水平偏高。标准差约为16,结合平均分综合分析,本次测试学生成绩两极分化较大。
(2)试题的区分度分析
怎样的试题才是“好的”试题?通过对区分度进行分析可以测试试题的好坏。项目的区分度,又称项目的鉴别力,指项目得分对被试者实际能力水平的区分能力或鉴别能力。常用鉴别指数D来表示项目的区分度,D=PH-PL,式中PH为高分组在该项目上的难度值,PL为低分组在该项目上的难度值。执行“分析(A)——描述统计(E)——频数分析表(F)”,选择对样本“总分”进行分析,可以获得各个分数出现的频率。
若我们将学生总分从高到低排列,从高分一端开始选取27%的学生作为高分组,从低分端选取27%的学生作为低分组。根据抽样人数(113个样本),分别计算出高分组和低分组的难度,可得本次考试该试题的区分度D=0.85-0.51=0.34,与评价标准(如下表所示)进行对比,D在0.30~0.39之间,本套试题的区分度属于“良好,修改后会更佳”。对试题区分度分析的目的是以便能更好地修正试题,为以后的测试积累经验。
2.学生答题情况分析
(1)不同大题的答题情况分析
每次考试结束后,教师首先关心的是学生在每个大题上的得分情况。在SPSS中,通过选择对各个大题的分析,可以轻松地获取学生的得分情况。执行“分析(A)——描述统计(E)——描述性统计分析(D)”,选择各个大题进入“变量”栏进行分析。
从以上分析得到的数据可以看出每个大题的得分情况,如“我会选”,平均得分27.6分(满分为30分),可求得该题的难度为0.92。最高分为30分,最低分为12分,标准差为3.8,和其他几个大题相比学生成绩波动性不大,学生得分较为理想。
同样也可以获得对某个大题得分情况的具体分析,如对“我会选”的分析,可执行“分析(A)——描述统计(E)——频数分析表(F)”,选择“我会选”进入“变量”栏进行分析。
(2)不同水平层次试题的答题情况分析
过去教师对于考试结果一般只关注学生的总分,无法对学生在不同能力层次上的发展水平做出更为细致的判断。因此关注学生在不同能力要素上的发展情况,能为教师改进教学提供更为实际的依据。执行“分析(A)——描述统计(E)——描述性统计分析(D)”,选择“各个水平能力层次”进入“变量”栏分析,可以获得抽样样本的得分情况。
如“事实性记忆”,抽样样本平均得分25.6分(试题满分为31分),可求得该题难度为0.84。最高得分31分,最低得分6分,标准差为3.8,和其他几个能力水平层次的得分相比,样本在此大题上的整体得分比较理想,学生成绩波动不是很大。
(3)个体之间的比较分析
①班级之间的比较分析
在考试结果分析中,教师一般会用平均分的高低来简单比较各班的成绩,利用SPSS软件的平均数差异显著性检验,可以进行更科学的统计分析。例如,用独立样本T检验比较三(3)、三(6)两个班的化学成绩是否有差异。执行“分析(A)——均值比较(M)——独立样本T检验(T)”获取报表。
输出结果给出了“假设方差相等”和“假设方差不相等”两种情况下的“方差相等的Levences检验”和“平均数相等的t检验”结果。两个班的化学成绩(总分)方差相等或不相等,应选择对应的统计量作为t检验的结果。本例中,因为“假设方差相等”的“显著性”为0.447,大于0.05(假设平均值的置信区间为95%,则不可置信区间为5%),则“假设方差相等”的条件满足。选取“假设方差不相等”行对应的分析结果,由于“平均数相等的t检验”中的“显著性(双尾)”值为0.744,也大于0.05,所以,接受均值相等的假设,即两班学生在这次考试整体成绩上没有显著差异。
②个人在集体中的情况
SPSS能提供强大的图示分析功能,能比较直观地显示出分析结果。以下以折线图为例来表现分析结果。执行“图表(G)——线图(L)——(根据具体报表需要选择不同的选项)”获取报表。图1为某学生、班级之间各个大题得分情况比较。
图1
从图示上可以比较清楚地获得两个班以及某学生在各个大题上的得分比较。如在“我会分析”这个大题上,三(3)班的得分明显好于三(6)班。
③学生之间的比较
同样可以利用折线图直观地看到分析结果。图2是不同学生在各个大题上得分情况的比较。
图2
SPSS统计软件为教师实施教学测量手段提供了一个较好的平台,尤其是它大量成熟的统计分析方法、灵活的统计表格和统计图形等为使用者提供了极大的方便。如何运用SPSS软件更好地来分析教学测试结果,还需要我们在使用过程中不断探索。
一、数据准备
1.建立测试的双向细目表,并根据双向细目表编拟试题
双向细目表是试题结构的直接体现,是确保试题符合测试目的和测量结构的有力保障。命题者根据课程标准、测试内容、测试的性质与功能和学科测量结构,一般以知识内容为纵轴,以能力水平、题型、难度值、分数为横轴建立。例如,我们在构建初中化学测试的双向细目表时,依据课程标准将内容分为“科学探究、身边的化学物质、物质构成的奥秘、物质的化学变化、化学与社会发展”五个内容主题。能力水平按层次分为“事实性记忆、概念的理解、规律的运用和问题的解决”,每个水平层次又再进行细分。试题的命制必须依据双向细目表的具体要求来编制。
2.对试题的难度进行预测
难度即项目的难易程度。难度值一般用全体受测者在该项目上的平均分除以该项目的满分得到。难度预测就是拟题人根据学生的学情对学生测试成绩的一种理性估计。试题的编拟者依据双向细目表对整个试卷及每个知识点的难度值都要进行客观的预测,以便和测试结果所获得的实际难度进行对照分析,为评估试题质量和学生成绩提供依据。綜合试卷难度预测结果为0.72(如下表所示)。
3.学生成绩统计
一般以试题的题号顺序为序在Excel中对每个知识点建立统计项目,再进行数据统计,也可以直接在SPSS中进行统计。
二、数据分析
1.试题的命制质量分析
(1)试题的难度分析
进行试卷难度分析是为了从整体上检测学生成绩是否达到拟题者的预设值,从而粗略地判断试题的命制质量。实际难度值高于预测难度值,说明试题偏易;实际难度值低于预测难度值,说明试题偏难。执行“分析(A)——描述统计(E)——描述统计分析(D)”,选择“总分”进入“变量”栏进行分析,可获得下列报表。
输出结果显示出总分变量的样本数、最高分、最低分、平均分和标准差(学生成绩的波动大小)五个常用的统计量。抽样对象的平均分为75.6分,可以看出该试卷的整体难度值约为0.76(卷面满分为100分),略高于出题者的预测难度0.72。原因可能是试题略简单,也可能是抽样的对象整体水平偏高。标准差约为16,结合平均分综合分析,本次测试学生成绩两极分化较大。
(2)试题的区分度分析
怎样的试题才是“好的”试题?通过对区分度进行分析可以测试试题的好坏。项目的区分度,又称项目的鉴别力,指项目得分对被试者实际能力水平的区分能力或鉴别能力。常用鉴别指数D来表示项目的区分度,D=PH-PL,式中PH为高分组在该项目上的难度值,PL为低分组在该项目上的难度值。执行“分析(A)——描述统计(E)——频数分析表(F)”,选择对样本“总分”进行分析,可以获得各个分数出现的频率。
若我们将学生总分从高到低排列,从高分一端开始选取27%的学生作为高分组,从低分端选取27%的学生作为低分组。根据抽样人数(113个样本),分别计算出高分组和低分组的难度,可得本次考试该试题的区分度D=0.85-0.51=0.34,与评价标准(如下表所示)进行对比,D在0.30~0.39之间,本套试题的区分度属于“良好,修改后会更佳”。对试题区分度分析的目的是以便能更好地修正试题,为以后的测试积累经验。
2.学生答题情况分析
(1)不同大题的答题情况分析
每次考试结束后,教师首先关心的是学生在每个大题上的得分情况。在SPSS中,通过选择对各个大题的分析,可以轻松地获取学生的得分情况。执行“分析(A)——描述统计(E)——描述性统计分析(D)”,选择各个大题进入“变量”栏进行分析。
从以上分析得到的数据可以看出每个大题的得分情况,如“我会选”,平均得分27.6分(满分为30分),可求得该题的难度为0.92。最高分为30分,最低分为12分,标准差为3.8,和其他几个大题相比学生成绩波动性不大,学生得分较为理想。
同样也可以获得对某个大题得分情况的具体分析,如对“我会选”的分析,可执行“分析(A)——描述统计(E)——频数分析表(F)”,选择“我会选”进入“变量”栏进行分析。
(2)不同水平层次试题的答题情况分析
过去教师对于考试结果一般只关注学生的总分,无法对学生在不同能力层次上的发展水平做出更为细致的判断。因此关注学生在不同能力要素上的发展情况,能为教师改进教学提供更为实际的依据。执行“分析(A)——描述统计(E)——描述性统计分析(D)”,选择“各个水平能力层次”进入“变量”栏分析,可以获得抽样样本的得分情况。
如“事实性记忆”,抽样样本平均得分25.6分(试题满分为31分),可求得该题难度为0.84。最高得分31分,最低得分6分,标准差为3.8,和其他几个能力水平层次的得分相比,样本在此大题上的整体得分比较理想,学生成绩波动不是很大。
(3)个体之间的比较分析
①班级之间的比较分析
在考试结果分析中,教师一般会用平均分的高低来简单比较各班的成绩,利用SPSS软件的平均数差异显著性检验,可以进行更科学的统计分析。例如,用独立样本T检验比较三(3)、三(6)两个班的化学成绩是否有差异。执行“分析(A)——均值比较(M)——独立样本T检验(T)”获取报表。
输出结果给出了“假设方差相等”和“假设方差不相等”两种情况下的“方差相等的Levences检验”和“平均数相等的t检验”结果。两个班的化学成绩(总分)方差相等或不相等,应选择对应的统计量作为t检验的结果。本例中,因为“假设方差相等”的“显著性”为0.447,大于0.05(假设平均值的置信区间为95%,则不可置信区间为5%),则“假设方差相等”的条件满足。选取“假设方差不相等”行对应的分析结果,由于“平均数相等的t检验”中的“显著性(双尾)”值为0.744,也大于0.05,所以,接受均值相等的假设,即两班学生在这次考试整体成绩上没有显著差异。
②个人在集体中的情况
SPSS能提供强大的图示分析功能,能比较直观地显示出分析结果。以下以折线图为例来表现分析结果。执行“图表(G)——线图(L)——(根据具体报表需要选择不同的选项)”获取报表。图1为某学生、班级之间各个大题得分情况比较。
图1
从图示上可以比较清楚地获得两个班以及某学生在各个大题上的得分比较。如在“我会分析”这个大题上,三(3)班的得分明显好于三(6)班。
③学生之间的比较
同样可以利用折线图直观地看到分析结果。图2是不同学生在各个大题上得分情况的比较。
图2
SPSS统计软件为教师实施教学测量手段提供了一个较好的平台,尤其是它大量成熟的统计分析方法、灵活的统计表格和统计图形等为使用者提供了极大的方便。如何运用SPSS软件更好地来分析教学测试结果,还需要我们在使用过程中不断探索。