论文部分内容阅读
[摘要] 试卷库建设关乎教考分离,关乎教学质量的提高,然而目前试卷库建设存在着建成不能使用、录入错误、试卷生成后没有审核、没有试运行、保密不嚴格等问题。本文从试卷库建设的整体注意事项及试卷几个分析标准,即试卷的难度、试卷的信度、试卷的效度、试卷的区分度和偏态值等入手展开试卷库建设与分析的讨论。
[关键词] 试卷命题试卷库分析 试卷的信度试卷的效度
教育的关键和核心是教学质量,教学质量由多方面的因素决定,教学质量的评判也有多种形式,其中课程考试是评判教学质量的主要形式之一。随着教学改革的不断深入,课程考试改革也在不断发展。目前公认的试卷库建设就是课程考试改革与发展的方向。
试卷库是在上课以前就形成的,是根据教学大纲的要求和学生的实际情况对各种试题进行任意的组合,大大提高了组卷的效率和质量,并可在没有任课教师参与的情况下组卷,使教学和考试基本分离,避免了教什么考什么的问题。试卷库的建设是个比较复杂的工程,要建立一套高质量的题库,必须具备一支专业的技术队伍,即要精通专业知识,又要掌握考试理论,还要掌握必要的计算机知识。
一、试卷库的命题与管理
就试卷库的命题而言,它是建立试卷库的基础,也是考试的中心环节,考试的指导思想也主要体现在命题上。因此,命题基本要求如下:
1、命题
覆盖要全面命题要根据课程教学大纲,命题范围覆盖课程的各章节的基本内容,引导学生全面掌握课程的教学内容和知识。
重点要突出每门课程都有最基本的、相对重要的、要求学生必须掌握的内容,在命题时应突出这些内容,通过较多的题量和较高的分值来体现。
难度要适中在严格按教学大纲命题的原则下,题目的深浅、难易要符合大多数学生的实际。一般而言,命题时基本题、提高及综合题和较高难度和深度的试题比例是6 :3 :1左右。考试结果一般应近似正态分布。每门课程要根据课程特点确定相应客观题型与主观题型及不同难易程度题目的比例,试题要能够体现出学生的学习水平。
题型要丰富每份试卷的题型应安排合理,可采用填空题、选择题(单项或多项)、判断题(是非题)等客观性题型和问答题、分析题、论述题、实验技能题、计算题、绘图题、证明题等主观性题型。也可根据各门课程的特点,选择其它较适合的题型。必要时,应对题型给出明确的说明或指导语。
题量要适度试题库的题量要充足,每种题型应有足够的可供选择的题量,试题难易要适度,在较难、中等、较易之间应保持适当比例,并保证A、B卷在题型、题量和难易程度上保持一致。同一章节内容应有不同层次、不同形式、不同难度的试题,以确保在组拼试卷时有多种选择。
2、试卷库的管理
试卷库的试卷量要充分每门课程客观题型题与主观题型的题量以不少于10-15套试卷的题量为宜。每套试卷的总分为100分。
用字要规范 试卷库、试卷库建设中,由于录入软件的限制,教师本人往往不能直接录入。而由于录入人员知识与能力的限制,录入产生的知识性与文字性错误经常产生。这样生成试卷以后,会影响考生正常考试。在录入时, 要规范使用汉字,做到题意明确,语言精炼,文字通顺,无错别字(符号),标点符号正确。
附件要齐全试题应有参考答案、评分标准和评分细则,属问答题、论述题、分析题等类型的试题可以不写出详细答案,但要列出答案要点及评分标准;属计算、证明题的,如要求按步骤给分的,应列出分步评分标准。
建成的试卷库要试运行 试卷库建成以后,必须进行调试。否则,真正考试时随机生成的试卷是容易产生问题的。一门课程的主要内容,可能重复出现在填空、选择题、简答、论述和证明题等各种题型中,导致试题内容覆盖面窄,不能全面反映教学情况。其次,试题分数的比重可能与教学的重点、难点错位。再其次,试题中的常识性错误也不能被及时发现和修改。
试卷库的更新 加强对试卷库、试卷库的维护。时代在变化,知识在更新,教师和学生也不同。因材施考、因时施考,及时对建成的试卷库、试卷库进行修改,才能准确反映教学的真实情况。
试卷库的保存试卷库建成后,以后的试卷就是从这里生成的,因此,试卷库的保密工作相当重要,如果泄密,不仅不能实现教考分离,反而导致教风、学风的败坏。由于试卷库、试卷库建成后,未来的试题就是从这里生成的,因此,试卷库的保密工作相当重要,如果泄密,不仅不能实现教考分离,反而导致教风、学风的败坏。
总而言之,在建设试卷库前要加强建库课程的选择。这是建设的起点与成功的关键。那种全面铺开、似乎越多越好的思想是不切实际的,也是有害的。不是什么课程都可以并需要建试卷库,只能选择那些知识点相对稳定、基础性的核心课程建设试卷库。其次,要严格保密纪律。试卷库、试卷库的保密十分重要,无论哪个环节出现泄密,都可能导致整个建设工作失去意义。再次,加强对试卷库、试卷库的维护。时代在变化,知识在更新,教师和学生也不同。因材施考、因时施考,是非常必要的。
二、试卷库的几个评价标准
一份试卷及其考试成绩可以反映出两方面的信息:一是教学质量,另一是学生水平。现有文献中一些评判指标有难度分析、效度分析、信度分析、区分度分析和偏态值分析。
难度 难度是用来评价试题难易程度的指标,是指考生对某题解答的的失败率,是评估试卷质量的主要指标之一。 影响试题难度的因素有试题本所测试的内容,试题的编制技术(即试题是否能清楚的描述题意), 被测对象(包括被测对象的实际水平以及被测对象有无学过试题所涉及的内容), 因此试题难度具有相对性. 对于在校生的学业成绩考核,一般都要求绝大部分同学的总成绩在60分以上,所以在进行试卷分析时应该根据考核目标对难度系数的适合区间进行重新划分。对于学业成绩考核,适当的难度系数应该是0.2左右(对应的平均成绩是80分),大于0.3(对应的平均成绩在70分以下)则偏难,小于0.15则难度过低(对应的平均分为85分以上)。
设P i为试卷中第 i 题的难度系数,为全体考生第 i 题平均分,Wi为第 i 题的满分,则第 i 题的难度为:。 如果 P 为试卷的难度系数,为试卷平均分,W 为试卷满分,则试卷的难度为:。
难度系数越趋近于0,难度就越小;难度系数越趋近于1,难度就越大。对于在校生的学业成绩考核,一般都要求绝大部分同学的总成绩在60分以上,所以在进行试卷分析时应该根据考核目标对难度系数的适合区间进行重新划分。对于学业成绩考核,适当的难度系数应该是0.2左右(对应的平均成绩是80分),大于0.3(对应的平均成绩在70分以下)则偏难,小于0.15则难度过低(对应的平均分为85分以上)。
区分度区分度又称为鉴别度, 是指试题或试卷对学生实际水平的区分程度或鉴别能力。区分度高的试题或试卷能对不同知识水平和能力的学生加以区分,使能力高的学生得高分,能力低的学生得低分区分度高的试题,能将不同水平的被试者区分开来。
目前区分度的计算方法较多是采用“两端分组法”,即把学生第 i 题考分由高到低排序,取前 27% 的学生作为高分组,取后 27% 的学生作为低分组,分别计算第 i 题高分组学生的平均成绩和低分组学生的平均成绩,设第i 题满分为,第 i 题区分度为,则:。 一般地,有值越大, 意味着此题对高、低组考生的区分能力越强. 对区分度指标的一般评价是: 如果≥0.4, 则此题的区分度为“优”; 如果0.3≤≤0.39, 则区分度为“良”; 如果0.2≤D ≤0.3, 则此试题区分度为“可”;如果D ≤0. 19, 此题目应淘汰。
信度 信度是指使用同一试卷对考生重复测验时,或两个平行试卷对考生测验时,所得測验分数的一致性和稳定性程度。它是从两个方面进行分析,一方面是考试成绩期望值与实际成绩平均值的差异,考试成绩期望值一般应以平时成绩的平均值为依据确定.另一方面是考试成绩的预期及格率与实际及格率的差异,考试成绩及格率的预期值同样以平时成绩的及格率为确定依据.两个方面的差异性较小,说明试卷信度较高。
信度的计算方法通常有重测法、复本法、半分法、库李法和克朗巴赫公式等。考虑到考试系统的实际情况,重测法需要对同一批考生在一个较长时间间隔内进行两次考试;复本法需要两份基本相同试卷在操作起来很难实现;半分法要把试题按题号分为两组,但是如果奇偶试题中都存在低质量试题,其相关系数—信度将降低;库李法要求使用到试题的难度系数,但是难度系数对不同群体有其相对性。因而在考试系统中常常采用克朗巴赫公式求信度。信度的计算公式为:。其中b表示试卷的信度,n表示试题总数,Si表示第i题标准差,S2表示试卷方差。 (m表示考生人数,表示第 j 个考生第 i 题的分数,表示全部考生第 i 题的平均分 ) , (m表示考生人数,表示第 j 个考生的总分数,表示全部考生的平均分 ) 。
一般认为,b<0.5的试卷信度较差, 0.5≤b≤0.8的试卷信度良好,b > 0.8 的试卷信度非常好。
效度 效度是衡量考试结果对考试目标实现程度的指标,效度反映了考试的准确性和有效性。提高考试的效度要注意两个方面的问题:一是考试的目标要明确,是要考核学生对基础知识的掌握,还是要考核学生应用知识进行推理判断的能力,或是两者兼而有之;二是试题的设计要能有效地体现考试目标,客观性试题一般用来考核学生对基础知识的掌握,非客观性试题则用来考核学生应用知识进行推理判断的能力。试卷的效度主要从内容效度和结构效度两方面进行分析.内容效度是试题所含知识点数与教学大纲中应试内容知识点数之比。结构效度用是指试题考核学生的记忆,分析和运用的各种方法以及各方面解决问题的能力点数与应试包含的各方面广泛与能力点数之比.比例较高则说明效度较高.根据当前情况,对于试卷效度的分析主要从内容效度进行分析,鼓励同时进行结构效度的分析. 试卷的效度可以通过试卷的平均区分度来衡量:。其中 r 表示试卷效度,表示第 i 题的区分度, n 表示试题总数。
一般认为r 0.4 的试卷才可以有效的实现考试的目标。
偏态值 偏态值是衡量成绩分布服从正态分布的程度。其计算公式为:(平均成绩 - 中位数)/标准差。一般来说,偏态值在 -1到+1 的范围之内就可以认为成绩基本呈正态分布。 中位数是这样一个分数:成绩高于中位数的人数和成绩低于中位数的人数各占50%。
考试是对讲授与学习效果的检验,是考查教学质量的重要手段和指标之一,对于教学发展的方向具有导向作用。考试结果能否准确反映出教学效果主要取决于考题和试卷的质量,因此,改变过去陈旧而单调的命题方法,大量引进和吸收先进、科学的现代化考核理论和方法,进一步学习考试理论和命题技巧,逐步建成符合各高校自己实际情况的现代化智能化试卷库,建立良好的试卷库对于保证和提高教学质量、培养学生的能力均具有非常重要的意义。
参考文献:
[1] 胡旭昶,试卷库相关参数及其具体实现[J],宁波大学学报 2004年第1期。
[2] 李述刚,薛莤 试卷库质量评价指标及应用[J],新疆医科大学学报,2005年12月第12期。
[3] 李田会,高等数学题库的理论参数和要求[J],陕西师范大学学报(自然科学版), 1999(27)(增刊): 1252127。
[4] 李金平,考试质量分析[J],江南大学学报(自然科学版)2004年第4期。
[5] 李伟, 高等学校教学质量评估中学生评教的有效性及对策研究[J],商场现代化, 2005 (21): 244~245。
[6] 戴忠恒,教育统计、测量与评价[M],北京: 中国科学技术出版社, 1990。
本文受安徽建筑工业学院教研项目支持(项目批号:2006JX12)
[关键词] 试卷命题试卷库分析 试卷的信度试卷的效度
教育的关键和核心是教学质量,教学质量由多方面的因素决定,教学质量的评判也有多种形式,其中课程考试是评判教学质量的主要形式之一。随着教学改革的不断深入,课程考试改革也在不断发展。目前公认的试卷库建设就是课程考试改革与发展的方向。
试卷库是在上课以前就形成的,是根据教学大纲的要求和学生的实际情况对各种试题进行任意的组合,大大提高了组卷的效率和质量,并可在没有任课教师参与的情况下组卷,使教学和考试基本分离,避免了教什么考什么的问题。试卷库的建设是个比较复杂的工程,要建立一套高质量的题库,必须具备一支专业的技术队伍,即要精通专业知识,又要掌握考试理论,还要掌握必要的计算机知识。
一、试卷库的命题与管理
就试卷库的命题而言,它是建立试卷库的基础,也是考试的中心环节,考试的指导思想也主要体现在命题上。因此,命题基本要求如下:
1、命题
覆盖要全面命题要根据课程教学大纲,命题范围覆盖课程的各章节的基本内容,引导学生全面掌握课程的教学内容和知识。
重点要突出每门课程都有最基本的、相对重要的、要求学生必须掌握的内容,在命题时应突出这些内容,通过较多的题量和较高的分值来体现。
难度要适中在严格按教学大纲命题的原则下,题目的深浅、难易要符合大多数学生的实际。一般而言,命题时基本题、提高及综合题和较高难度和深度的试题比例是6 :3 :1左右。考试结果一般应近似正态分布。每门课程要根据课程特点确定相应客观题型与主观题型及不同难易程度题目的比例,试题要能够体现出学生的学习水平。
题型要丰富每份试卷的题型应安排合理,可采用填空题、选择题(单项或多项)、判断题(是非题)等客观性题型和问答题、分析题、论述题、实验技能题、计算题、绘图题、证明题等主观性题型。也可根据各门课程的特点,选择其它较适合的题型。必要时,应对题型给出明确的说明或指导语。
题量要适度试题库的题量要充足,每种题型应有足够的可供选择的题量,试题难易要适度,在较难、中等、较易之间应保持适当比例,并保证A、B卷在题型、题量和难易程度上保持一致。同一章节内容应有不同层次、不同形式、不同难度的试题,以确保在组拼试卷时有多种选择。
2、试卷库的管理
试卷库的试卷量要充分每门课程客观题型题与主观题型的题量以不少于10-15套试卷的题量为宜。每套试卷的总分为100分。
用字要规范 试卷库、试卷库建设中,由于录入软件的限制,教师本人往往不能直接录入。而由于录入人员知识与能力的限制,录入产生的知识性与文字性错误经常产生。这样生成试卷以后,会影响考生正常考试。在录入时, 要规范使用汉字,做到题意明确,语言精炼,文字通顺,无错别字(符号),标点符号正确。
附件要齐全试题应有参考答案、评分标准和评分细则,属问答题、论述题、分析题等类型的试题可以不写出详细答案,但要列出答案要点及评分标准;属计算、证明题的,如要求按步骤给分的,应列出分步评分标准。
建成的试卷库要试运行 试卷库建成以后,必须进行调试。否则,真正考试时随机生成的试卷是容易产生问题的。一门课程的主要内容,可能重复出现在填空、选择题、简答、论述和证明题等各种题型中,导致试题内容覆盖面窄,不能全面反映教学情况。其次,试题分数的比重可能与教学的重点、难点错位。再其次,试题中的常识性错误也不能被及时发现和修改。
试卷库的更新 加强对试卷库、试卷库的维护。时代在变化,知识在更新,教师和学生也不同。因材施考、因时施考,及时对建成的试卷库、试卷库进行修改,才能准确反映教学的真实情况。
试卷库的保存试卷库建成后,以后的试卷就是从这里生成的,因此,试卷库的保密工作相当重要,如果泄密,不仅不能实现教考分离,反而导致教风、学风的败坏。由于试卷库、试卷库建成后,未来的试题就是从这里生成的,因此,试卷库的保密工作相当重要,如果泄密,不仅不能实现教考分离,反而导致教风、学风的败坏。
总而言之,在建设试卷库前要加强建库课程的选择。这是建设的起点与成功的关键。那种全面铺开、似乎越多越好的思想是不切实际的,也是有害的。不是什么课程都可以并需要建试卷库,只能选择那些知识点相对稳定、基础性的核心课程建设试卷库。其次,要严格保密纪律。试卷库、试卷库的保密十分重要,无论哪个环节出现泄密,都可能导致整个建设工作失去意义。再次,加强对试卷库、试卷库的维护。时代在变化,知识在更新,教师和学生也不同。因材施考、因时施考,是非常必要的。
二、试卷库的几个评价标准
一份试卷及其考试成绩可以反映出两方面的信息:一是教学质量,另一是学生水平。现有文献中一些评判指标有难度分析、效度分析、信度分析、区分度分析和偏态值分析。
难度 难度是用来评价试题难易程度的指标,是指考生对某题解答的的失败率,是评估试卷质量的主要指标之一。 影响试题难度的因素有试题本所测试的内容,试题的编制技术(即试题是否能清楚的描述题意), 被测对象(包括被测对象的实际水平以及被测对象有无学过试题所涉及的内容), 因此试题难度具有相对性. 对于在校生的学业成绩考核,一般都要求绝大部分同学的总成绩在60分以上,所以在进行试卷分析时应该根据考核目标对难度系数的适合区间进行重新划分。对于学业成绩考核,适当的难度系数应该是0.2左右(对应的平均成绩是80分),大于0.3(对应的平均成绩在70分以下)则偏难,小于0.15则难度过低(对应的平均分为85分以上)。
设P i为试卷中第 i 题的难度系数,为全体考生第 i 题平均分,Wi为第 i 题的满分,则第 i 题的难度为:。 如果 P 为试卷的难度系数,为试卷平均分,W 为试卷满分,则试卷的难度为:。
难度系数越趋近于0,难度就越小;难度系数越趋近于1,难度就越大。对于在校生的学业成绩考核,一般都要求绝大部分同学的总成绩在60分以上,所以在进行试卷分析时应该根据考核目标对难度系数的适合区间进行重新划分。对于学业成绩考核,适当的难度系数应该是0.2左右(对应的平均成绩是80分),大于0.3(对应的平均成绩在70分以下)则偏难,小于0.15则难度过低(对应的平均分为85分以上)。
区分度区分度又称为鉴别度, 是指试题或试卷对学生实际水平的区分程度或鉴别能力。区分度高的试题或试卷能对不同知识水平和能力的学生加以区分,使能力高的学生得高分,能力低的学生得低分区分度高的试题,能将不同水平的被试者区分开来。
目前区分度的计算方法较多是采用“两端分组法”,即把学生第 i 题考分由高到低排序,取前 27% 的学生作为高分组,取后 27% 的学生作为低分组,分别计算第 i 题高分组学生的平均成绩和低分组学生的平均成绩,设第i 题满分为,第 i 题区分度为,则:。 一般地,有值越大, 意味着此题对高、低组考生的区分能力越强. 对区分度指标的一般评价是: 如果≥0.4, 则此题的区分度为“优”; 如果0.3≤≤0.39, 则区分度为“良”; 如果0.2≤D ≤0.3, 则此试题区分度为“可”;如果D ≤0. 19, 此题目应淘汰。
信度 信度是指使用同一试卷对考生重复测验时,或两个平行试卷对考生测验时,所得測验分数的一致性和稳定性程度。它是从两个方面进行分析,一方面是考试成绩期望值与实际成绩平均值的差异,考试成绩期望值一般应以平时成绩的平均值为依据确定.另一方面是考试成绩的预期及格率与实际及格率的差异,考试成绩及格率的预期值同样以平时成绩的及格率为确定依据.两个方面的差异性较小,说明试卷信度较高。
信度的计算方法通常有重测法、复本法、半分法、库李法和克朗巴赫公式等。考虑到考试系统的实际情况,重测法需要对同一批考生在一个较长时间间隔内进行两次考试;复本法需要两份基本相同试卷在操作起来很难实现;半分法要把试题按题号分为两组,但是如果奇偶试题中都存在低质量试题,其相关系数—信度将降低;库李法要求使用到试题的难度系数,但是难度系数对不同群体有其相对性。因而在考试系统中常常采用克朗巴赫公式求信度。信度的计算公式为:。其中b表示试卷的信度,n表示试题总数,Si表示第i题标准差,S2表示试卷方差。 (m表示考生人数,表示第 j 个考生第 i 题的分数,表示全部考生第 i 题的平均分 ) , (m表示考生人数,表示第 j 个考生的总分数,表示全部考生的平均分 ) 。
一般认为,b<0.5的试卷信度较差, 0.5≤b≤0.8的试卷信度良好,b > 0.8 的试卷信度非常好。
效度 效度是衡量考试结果对考试目标实现程度的指标,效度反映了考试的准确性和有效性。提高考试的效度要注意两个方面的问题:一是考试的目标要明确,是要考核学生对基础知识的掌握,还是要考核学生应用知识进行推理判断的能力,或是两者兼而有之;二是试题的设计要能有效地体现考试目标,客观性试题一般用来考核学生对基础知识的掌握,非客观性试题则用来考核学生应用知识进行推理判断的能力。试卷的效度主要从内容效度和结构效度两方面进行分析.内容效度是试题所含知识点数与教学大纲中应试内容知识点数之比。结构效度用是指试题考核学生的记忆,分析和运用的各种方法以及各方面解决问题的能力点数与应试包含的各方面广泛与能力点数之比.比例较高则说明效度较高.根据当前情况,对于试卷效度的分析主要从内容效度进行分析,鼓励同时进行结构效度的分析. 试卷的效度可以通过试卷的平均区分度来衡量:。其中 r 表示试卷效度,表示第 i 题的区分度, n 表示试题总数。
一般认为r 0.4 的试卷才可以有效的实现考试的目标。
偏态值 偏态值是衡量成绩分布服从正态分布的程度。其计算公式为:(平均成绩 - 中位数)/标准差。一般来说,偏态值在 -1到+1 的范围之内就可以认为成绩基本呈正态分布。 中位数是这样一个分数:成绩高于中位数的人数和成绩低于中位数的人数各占50%。
考试是对讲授与学习效果的检验,是考查教学质量的重要手段和指标之一,对于教学发展的方向具有导向作用。考试结果能否准确反映出教学效果主要取决于考题和试卷的质量,因此,改变过去陈旧而单调的命题方法,大量引进和吸收先进、科学的现代化考核理论和方法,进一步学习考试理论和命题技巧,逐步建成符合各高校自己实际情况的现代化智能化试卷库,建立良好的试卷库对于保证和提高教学质量、培养学生的能力均具有非常重要的意义。
参考文献:
[1] 胡旭昶,试卷库相关参数及其具体实现[J],宁波大学学报 2004年第1期。
[2] 李述刚,薛莤 试卷库质量评价指标及应用[J],新疆医科大学学报,2005年12月第12期。
[3] 李田会,高等数学题库的理论参数和要求[J],陕西师范大学学报(自然科学版), 1999(27)(增刊): 1252127。
[4] 李金平,考试质量分析[J],江南大学学报(自然科学版)2004年第4期。
[5] 李伟, 高等学校教学质量评估中学生评教的有效性及对策研究[J],商场现代化, 2005 (21): 244~245。
[6] 戴忠恒,教育统计、测量与评价[M],北京: 中国科学技术出版社, 1990。
本文受安徽建筑工业学院教研项目支持(项目批号:2006JX12)