论文部分内容阅读
作者简介:刘潘(1988.-),男,汉,江苏徐州,硕士研究生,南京财经大学经济学院,社会经济统计。
摘要:提高考试的区分度是提高考试质量的重要课题,本文基于当下流行的计算机考试及评分系统,创新性的提出根据难度分配得分,从而使得分更加准确的反映考生能力,从改变得分机制角度提高考试区分度。
关键词:考试质量;区分度;得分机制
一.引言
在教育测量学理论中,如何测度试题区分度是重要的话题。区分度是指试题对不同应试者的知识、能力水平的鉴别程度。一般认为,区分度的数值达到了0.3便可以接受,低于0.3的题目区分能力差。
二.区分度计算方法概述
区分度的计算一般是从考题的作答情况与考生的实际能力是否相符来考察。以实际得分反映作答情况的好坏,以考生卷面总得分反映考生能力。如果两者具有一定程度的相关性,则表明题目具有良好的区分度。区分度的典型计算方法可以分为两类:第一类统称为相关系数法,包括点二列相关法、二列相关法、积差相关法等;第二类称为极端分组法。
相关系数法本质上都是计算题目得分与总分的相关系数,主要区别在于所适用的数据特点的不同。点二列相关法和二列相关法都适用于连续变量与二分变量之间的相关关系測量,而积差相关法适用于两个连续变量之间相关系数的测量。
相对于点二列相关法,二列相关法更切合实际。答对者中正确理解的程度是不相同的,完全正确理解者只是少数,答错者错误理解的程度也是不相同的,完全错误理解者也只是少数,而处于中间状态的人是大多数,可以将所有考生对某题的理解程度视为正态连续变量,人为的把这种不同程度的理解划分为两种情况,即理解和不理解。
极端分组法是一种计算简便,易于理解的算法,它与相关系数法的理论基础不同,其分组原理是:将考生的试卷依总分由高到低排序,从最高分开始,依次向下顺次选取全部试卷的27%作为高分组;从得分最低开始,依次向上顺次选取全部试卷的27%作为低分组。
采用点二列相关法、二列相关法与极端分组法计算同一类型的题目的区分度,依据区分度的评判标准,结论会出现不一致,可能会出现某一指标过高或过低估计区分度的情况。两种方法计算出的区分度没有可比性,但可以确定的是相关系数法利用了全部样本数据,而分组法只利用了一部分数据资料,浪费了很多信息,准确度较前者低。
三.改善得分机制,提高区分度
如何提高考试的区分度?一直以来主要依靠命题人对试题的主观把握,而本文接下来将从一个另外的角度——改善得分机制,发掘提高命题区分度的方法。现代许多考试采用计算机评分,节省了大量的人工成本,并可大大提高主观因素的误差和干扰。但是对于计算机的应用很多情况下仍旧局限于简单的代替人工评分,我们应该更充分的挖掘计算机在改善考试质量方面的应用。
在客观题中,选择题占据着很大的比重。一直以来,选择题的得分机制就是简单的0—1得分制,即答对得分,答错不得分,偶尔有个别考试在多选题部分会采取少选得部分分值的得分制。这种做法很方便,但是不可否认,这种得分制在用以评价考生能力的角度上存在明确的缺陷。答对某一题的考生权且可以认为真正理解了出题人本意并做出了正确答案,但是对于答错的考生,他们对于题目的理解并不都是同等程度的错误的,如果一概的将其视为得零分,则在很大程度上丧失了该题目在区分考生能力上的能力。
多选题其实是能够区分考生能力的一种很好地题型,但是不难发现,现在的机考环境中多选题出现的频率还是很小的,很重要的一点原因就是多选题“答错不得分”这种严格的得分机制,如果稍微增加题目难度,就会造成大面积的考生得零分,导致整卷平均分偏低。其实,在计算机评卷的环境下,可以充分利用计算机在运算方面的效率,将多选题的得分机制细化,使多选题充分发挥区分考生能力的作用。根据多选题题型的特点,可以根据选项难度分配各选项的分数,如果考生正确判断具体选项就能得到相应分数,由此计算基于考生理解程度的每题应当得分。
下面通过一个简单的例子说明如何通过难度细化得分。如一个多选题有ABCD四个选项,正确选项BC,选对得1分,选错不得分,100个考生参与考试。统计考生选择的各种组合情形中各选择支的频数,假如共23A,44B,60C,18D,则各选项难度系数为0.77,0.44,0.60,0.82,由于难度系数是根据答对的情况决定的,其表现形式是数值越大,难度越小,所以为了方便确定各选项的分值,在此将难度系数调整为从正面反应难度大小的系数,即用答错的比例除以总比例,在此将其定义为错误比例。本题各选项的错误比例为0.23,0.56,0.40,0.18,据此分配选项的分数权重,重新计算各考生的题目得分。如某考生选择ABC,表明他判断对了BCD选项,则对应得分为0.408759+0.291971+0.131387=0.832117。经过如此处理后,得分已经能在很大程度上真实反映考生对题目的理解程度。
这种方法还可以推广到单选题中去,主要运用的理论也是根据难度将考生得分进行细化,如可以根据选择某一选项人数的比例确定该选项的难度,从而将严格的“0—1”得分机制变为更能体现能力多样性的多元得分机制。
值得注意的是,这种细化得分的方法在人工阅卷的情况下是很难做到的,因为涉及到针对所有考生成绩的运算,但是在计算机评卷环境下,可以在评分软件中添加相关的程序,充分利用计算机的运算功能,短时间内迅速得出细化后的得分,是一种非常可行的做法。(作者单位:南京财经大学)
参考文献:
[1]王孝玲.教育测量[M].华东师范大学出版社,2005.8:64-81.
[2]吴珍珠. 探讨试题难度与区分度的关系[J]. 教育教学论坛,2011,30:235-237.
摘要:提高考试的区分度是提高考试质量的重要课题,本文基于当下流行的计算机考试及评分系统,创新性的提出根据难度分配得分,从而使得分更加准确的反映考生能力,从改变得分机制角度提高考试区分度。
关键词:考试质量;区分度;得分机制
一.引言
在教育测量学理论中,如何测度试题区分度是重要的话题。区分度是指试题对不同应试者的知识、能力水平的鉴别程度。一般认为,区分度的数值达到了0.3便可以接受,低于0.3的题目区分能力差。
二.区分度计算方法概述
区分度的计算一般是从考题的作答情况与考生的实际能力是否相符来考察。以实际得分反映作答情况的好坏,以考生卷面总得分反映考生能力。如果两者具有一定程度的相关性,则表明题目具有良好的区分度。区分度的典型计算方法可以分为两类:第一类统称为相关系数法,包括点二列相关法、二列相关法、积差相关法等;第二类称为极端分组法。
相关系数法本质上都是计算题目得分与总分的相关系数,主要区别在于所适用的数据特点的不同。点二列相关法和二列相关法都适用于连续变量与二分变量之间的相关关系測量,而积差相关法适用于两个连续变量之间相关系数的测量。
相对于点二列相关法,二列相关法更切合实际。答对者中正确理解的程度是不相同的,完全正确理解者只是少数,答错者错误理解的程度也是不相同的,完全错误理解者也只是少数,而处于中间状态的人是大多数,可以将所有考生对某题的理解程度视为正态连续变量,人为的把这种不同程度的理解划分为两种情况,即理解和不理解。
极端分组法是一种计算简便,易于理解的算法,它与相关系数法的理论基础不同,其分组原理是:将考生的试卷依总分由高到低排序,从最高分开始,依次向下顺次选取全部试卷的27%作为高分组;从得分最低开始,依次向上顺次选取全部试卷的27%作为低分组。
采用点二列相关法、二列相关法与极端分组法计算同一类型的题目的区分度,依据区分度的评判标准,结论会出现不一致,可能会出现某一指标过高或过低估计区分度的情况。两种方法计算出的区分度没有可比性,但可以确定的是相关系数法利用了全部样本数据,而分组法只利用了一部分数据资料,浪费了很多信息,准确度较前者低。
三.改善得分机制,提高区分度
如何提高考试的区分度?一直以来主要依靠命题人对试题的主观把握,而本文接下来将从一个另外的角度——改善得分机制,发掘提高命题区分度的方法。现代许多考试采用计算机评分,节省了大量的人工成本,并可大大提高主观因素的误差和干扰。但是对于计算机的应用很多情况下仍旧局限于简单的代替人工评分,我们应该更充分的挖掘计算机在改善考试质量方面的应用。
在客观题中,选择题占据着很大的比重。一直以来,选择题的得分机制就是简单的0—1得分制,即答对得分,答错不得分,偶尔有个别考试在多选题部分会采取少选得部分分值的得分制。这种做法很方便,但是不可否认,这种得分制在用以评价考生能力的角度上存在明确的缺陷。答对某一题的考生权且可以认为真正理解了出题人本意并做出了正确答案,但是对于答错的考生,他们对于题目的理解并不都是同等程度的错误的,如果一概的将其视为得零分,则在很大程度上丧失了该题目在区分考生能力上的能力。
多选题其实是能够区分考生能力的一种很好地题型,但是不难发现,现在的机考环境中多选题出现的频率还是很小的,很重要的一点原因就是多选题“答错不得分”这种严格的得分机制,如果稍微增加题目难度,就会造成大面积的考生得零分,导致整卷平均分偏低。其实,在计算机评卷的环境下,可以充分利用计算机在运算方面的效率,将多选题的得分机制细化,使多选题充分发挥区分考生能力的作用。根据多选题题型的特点,可以根据选项难度分配各选项的分数,如果考生正确判断具体选项就能得到相应分数,由此计算基于考生理解程度的每题应当得分。
下面通过一个简单的例子说明如何通过难度细化得分。如一个多选题有ABCD四个选项,正确选项BC,选对得1分,选错不得分,100个考生参与考试。统计考生选择的各种组合情形中各选择支的频数,假如共23A,44B,60C,18D,则各选项难度系数为0.77,0.44,0.60,0.82,由于难度系数是根据答对的情况决定的,其表现形式是数值越大,难度越小,所以为了方便确定各选项的分值,在此将难度系数调整为从正面反应难度大小的系数,即用答错的比例除以总比例,在此将其定义为错误比例。本题各选项的错误比例为0.23,0.56,0.40,0.18,据此分配选项的分数权重,重新计算各考生的题目得分。如某考生选择ABC,表明他判断对了BCD选项,则对应得分为0.408759+0.291971+0.131387=0.832117。经过如此处理后,得分已经能在很大程度上真实反映考生对题目的理解程度。
这种方法还可以推广到单选题中去,主要运用的理论也是根据难度将考生得分进行细化,如可以根据选择某一选项人数的比例确定该选项的难度,从而将严格的“0—1”得分机制变为更能体现能力多样性的多元得分机制。
值得注意的是,这种细化得分的方法在人工阅卷的情况下是很难做到的,因为涉及到针对所有考生成绩的运算,但是在计算机评卷环境下,可以在评分软件中添加相关的程序,充分利用计算机的运算功能,短时间内迅速得出细化后的得分,是一种非常可行的做法。(作者单位:南京财经大学)
参考文献:
[1]王孝玲.教育测量[M].华东师范大学出版社,2005.8:64-81.
[2]吴珍珠. 探讨试题难度与区分度的关系[J]. 教育教学论坛,2011,30:235-237.