论文部分内容阅读
多选题因其自身的优势,一直受到各种考试的青睐,也是英语阅读理解中最常见的题型。近年来,虽然开始出现简答题,但多选题仍是命题人员的首选,且占据着主体地位。当然,多选题作为客观题型也有其不足之处,使得其饱受争议。如命题难度大,干扰项的编写和设计等对命题人员的语言水平,知识面以及实践经验都要求甚高。如控制不力,极易影响试卷的整体效度和信度。再次,多选题本身为猜测概率极高的题型,如设A、B、C、D四个选项,答案项的猜测概率即达到25%。如不精心编制和设计,猜测概率将会大大提高甚至完全可猜。这样既与考查学生阅读理解能力的考试目标相悖,也不符合考试公平公正原则。邓杰(2009)在深入研究多选题命题原则和猜题策略的基础上,针对多选题的可猜性提出一套可控指标,并用这套指标,采用专家评判一致性的实证方法证明了其指标的效度和信度,虽然样本量略显不足,但其结果在很大程度上体现了指标的实用性和可操作性,并从这个侧面证明了2008年高考卷全国卷I和某省卷在多选题命题中存在的缺陷,同时提出了可控措施。本研究即在此基础,采用这套指标对2009年高考全国卷(I,Ⅱ)和某省卷阅读理解部分多选题进行评判,以检测在扩充样本量的情况下,指标是否依然能有效评测出试卷命题期间的可猜测性程度,并检验指标的效度和信度。为了与之保持一致,本研究同样采用专家评判一致的实证方法,通过统计软件SPSS16.0对评判专家的评判采用Pearson相关系数和肯德尔协同系数予以说明。通过对各卷进行单样本t检验描述各卷的可猜概率以及体现出的主要指标,并分析干扰项和答案项在可猜性方面的分布情况以测干扰项的干扰功能和答案项的构念效度。最后,文章在综合以上两个方面的分析结果并对评判指标使用频率进行统计的后下,有针对性的提出在命题过程中一些具体的可控措施。实验结果表明,在对适合的评判者使用这套指标进行足量的培训情况下,评判者的评判一致性能达到较为理想的状态;全国卷Ⅰ(2009,2010)和全国卷Ⅱ(2009,2010),以及某省卷在命题期间对选项可猜性的控制情况均存在一定的不足,其中全国卷Ⅱ(2009)的20道多选题,可猜题有11道,可猜概率到达55%,而全国卷Ⅱ(2009)的猜测概率也达到50%,全国卷Ⅰ(2010),可猜概率为30%,而全国卷Ⅱ(2010)猜测概率为40%。可见,为了提高试卷的效度和信度,在命题期间对多选题选项可猜性的控制十分必要。