试卷评估分析与试题改进的研究

来源 :软件 | 被引量 : 0次 | 上传用户:wjz5201
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘 要:完善的试题、试卷评估分析软件不仅能够全面、准确、客观地对考生掌握知识情况进行正确的评价,而且可以通过对试题的取舍、修改和完善,不断提高试题的质量,以达到准确考查教学情况和正确、公平遴选优秀人才的目的。本文改进和开发了windows系统下的试题、试卷评估分析软件,实例分析,图文并茂,简单直观,有助于改进试题、试卷质量,对提高正确评估考试有重要参考价值。
  关键词:试题、试卷评估分析软件;难度;区分度;信度;效度
  中图分类号:G642.4 文献标识码:A DOI:10.3969/j.issn.1003-6970.2013.06.048
  1引言
  考试是遴选人才的重要手段,也是教育评估中不可缺少的重要评价环节,既要考察出考生掌握知识的程度,区分出各种层次的学生,又要反映出学生的真实水平。因此,每次出题考试都应非常慎重,特别是高考、研究生招生考试和公务员考试等国考,更是关系到国家的利益,关系到考生一生的命运,尤为重要。所以,我们有必要对每次考试的试题、试卷进行综合分析,得出哪些试题适合作为考题,放入试题库中;对不太适合作为考题的试题进行舍弃或修改,提高考试试题的质量,通过不断的积累,建立完善的试题库系统。
  试题、试卷的评价体系主要分为难度、区分度、信度和效度分析[1]。通过对试题、试卷这四方面的分析来判断出试题、试卷质量的好坏。为客观评价考生和遴选各种人才提供准确的参考。
  1.1难度
  难度为试题的难易程度,是考生应试水平和试题深度相对而言的。用以计算的公式为:
  式中:为难度值;为该试题的满分值;为该题得分的平均值。
  由此可知,若,则表示无一人得分,该题极难;若,则表示每个人都答对,该题极易。这两种情况对区分度来说都没有意义的。对于一般性教学试题,难度应控制在0.3~0.4之间。
  1.2区分度
  区分度为试题对每位考生水平的鉴别能力。若某试题能将不同水平学生的成绩区分开来,则表示该题的区分度高;反之,若某试题考生都能答对或无一答对,则无区分度可言。常见的区分度算法为:将考生的该题成绩从高到低排列,各取总人数27%的学生分成高分组和低分组,将高分组的总得分减去低分组的总分,除以各组的人数与该题的满分值的乘积,则区分度表示为:
  式中:值越大表示该题区分度越高,最大值为1,表示高分组的所有同学答该题全对,低分组则全错;则说明该题没有区分能力;一般认为区分度为很好;0.3~0.4是良好,0.2~0.3为合格,<0.2表示区分度太低。
  1.3信度
  信度为考查考试结果是否稳定和可靠的一种指标,反应学生成绩的一致性,表明一次考试反映学生真实水平的程度。一份信度较高的试卷,在大致相同的班级进行测试,所得成绩应基本一致。成绩中偶然因素少,可靠性较大。若两次考试成绩差异很大,则说明信度低。
  常采用的算法为半分法。即把某次考试的考生分成奇、偶两部分,并看作为水平相同的两次考试,按下式计算两次考试的相关系数:
  式中:—学号为奇数的第位学生的成绩;—学号为奇数的学生的总平均成绩;
  —学号为偶数的第位学生的成绩;—学号为偶数的学生的总平均成绩。
  当时,则表示奇、偶两部分学生所得总成绩相当,考试结果与学生的实际水平没有任何误差,考分是稳定可靠的;若,则表示该题根本不能反映学生实际水平,分数毫无意义;若和时,表示试卷信度好。一般信度应高于0.5或低于-0.5。
  1.4效度
  效度指试卷结果能否正确地、有效地反映学生真实水平,它是教育评估中的一个难点。教育学专家的观点也各不同,目前常用的效度指标为试卷平均区分度的值。效度为:
  式中:为效度,一般效度应大于0.2;为试题个数;
  为第题的区分度。
  以上四个指标虽然从单方面量化了试题与试卷质量,但他们是相互联系的。通过几个指标的综合分析才能正确、全面评价试题与试卷质量。
  2 试题、试卷评估分析软件
  软件的界面最顶部为菜单栏;左边灰色区域为显示数据界面;右边为操作界面。
  具体操作步骤如下:
  2.1将考生的学号、每个题所得分数和总成绩依次输入文本文档中。
  2.2从菜单栏文件中打开文本文档。
  2.3在界面右侧输入试卷名称、考试题数、命题人、考试人数、考试日期、试题满分值和每个题的满分值。
  2.4点击信度按钮可得到信度值;点击效度按钮可得效度值;本题难度值里,首先选择题目数,再点击本题难度值按钮可得该题难度值;同理,本题区分度里,先选择题目数,再点击按钮可得该题区分度值;点击总平均分按钮可得总平均分。
  2.5依次点击对比列表、分数统计表、成绩排序、分数段统计、区分度图示和难度图示按钮,数据或图形会依次显示在界面左侧的灰色区域。
  2.6打开菜单文件,可逐一保存分析结果、成绩排序、分数统计图、区分度图示和难度图示。
  3实例分析
  我们应用该试题、试卷评估分析软件对我校机械专业2010-2011第二学期的理论力学课程考试情况进行了评估分析,分析结果见试题、试卷分析软件主界面图1,各试题的难度、区分度对比列表见图2,难度、区分度柱状图见图3、图4,各分数段的统计分析见图5。
  通过以上图表分析可以得出,该套试卷这次考试信度:-0.25138212,信度较低;效度:0.61214290,效度较好;平均分:66.92208000。从图2、图3和图4中得出第一题的难度系数太小(为0.0941558441558441),区分度一般(为0.3625),区分不出各层次的学生。应将其完善和修改,同时教师应从考试中找到学生对知识掌握中存在的问题,改进自己的教学。
  4 结论
  通过对试题、试卷的评估分析,可改进考题、考卷的质量,提高试卷的可信度和效度。为教育教学评估向着正确性和准确性发展提供了改进办法,为命题、考试提供了重要的参考。
  参考文献
  [1] 王永岩.题库建设中的四度分析[J].力学与实践,1993,15(1) :61-62
  WANG Y Y. Statistical Analysis of four Degrees in item Banking[J].Mechanics in Engineering,1993,15(1):61-62.(in Chinese)
其他文献
【摘 要】教育改革的火热实施催生出了越来越多的教学模式,小组合作学习也被赋予了更多的含義和作用,目前正在全面推广,在不同学段及不同学科的课堂上发挥着重要的作用。在高中数学课堂上,小组合作学习也彰显出了不可比拟的优势,有着极大的应用价值。无论是教师还是教研工作者,都应该对有效的小组合作学习展开探索。本文也将针对高中数学教学,提出几点小组合作学习的实施要点及策略。  【关键词】小组合作学习;高中;数学
人脸识别问题在很多情况下都会面临小训练样本的问题,在训练样本数量远小于数据维数的情形下许多人脸识别方法都会遇到困难。本文分析了造成小样本问题的原因,从虚拟样本扩充、数据降维以及算法优化等不同方面总结了解决方法,并对不同方法进行了简要评价,对解决小样本问题的未来发展方向进行了展望。
随着电信行业间的竞争加剧,运营商更加应该专注于服务的质量。以非法回拨电话为代表的非法行为会扰乱用户的正常生活。如何快速准确地检测出非法回拨异常用户的问题亟待解决。
随着玉溪供电局企业信息化进程的飞速发展,企业内部业务部门对IT部门所提供信息的安全性要求也越来越高。其次,服务器海量数据的不断增长,数据的体积变得越来越庞大。更重要的是
为了满足企事业单位对日常办公信息化处理的人才需求,围绕〈〈Office高级办公应用》核心课程,与《计算机应用基础》、《办公设备使用与维护》、《常用办公工具软件》以及《Phot
【摘 要】小学语文的写作教学一直在语文教学中占据重要的地位,它可以培养学生基础的写作能力和表达能力。但小学语文写作教学一直是一个难点,目前在小学教学的过程中还存在很多问题,学生写作水平难以突破的问题成了广大师生关注的焦点,并一直困扰着小学语文教育质量的发展。因此,本文主要就目前小学语文写作教学存在的问题与改进策略进行分析,希望可以为小学语文教师提升学生的写作水平提供一定的经验。  【关键词】小学语
在激烈的市场竞争中,现代企业管理的重心已由传统的以“产品为中心”,过渡到了“以客户为中心”,客户关系管理已成为众多企业管理者极为重视的内容,但在对客户关系管理的认识上还
在中国“一带一路”和文化“走出去”的大背景下,外宣翻译越来越受到重视,十九大以来更是成为翻译界热议的话题。外宣翻译作为一种翻译种类,因其政治性、准确性和灵活性而具
建国以来,中国对西部地区有过两次大开发."一五"期间,在国家156项重大骨干项目中不少安置在西部地区.仅陕西和甘肃两省就领到40个项目;"三线建设"时期,国家先后投资2050亿元,