多选题命题质量控制实证研究

被引量 : 0次 | 上传用户:JackCF1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
多选题因其自身的优势,一直受到各种考试的青睐,也是英语阅读理解中最常见的题型。近年来,虽然开始出现简答题,但多选题仍是命题人员的首选,且占据着主体地位。当然,多选题作为客观题型也有其不足之处,使得其饱受争议。如命题难度大,干扰项的编写和设计等对命题人员的语言水平,知识面以及实践经验都要求甚高。如控制不力,极易影响试卷的整体效度和信度。再次,多选题本身为猜测概率极高的题型,如设A、B、C、D四个选项,答案项的猜测概率即达到25%。如不精心编制和设计,猜测概率将会大大提高甚至完全可猜。这样既与考查学生阅读理解能力的考试目标相悖,也不符合考试公平公正原则。邓杰(2009)在深入研究多选题命题原则和猜题策略的基础上,针对多选题的可猜性提出一套可控指标,并用这套指标,采用专家评判一致性的实证方法证明了其指标的效度和信度,虽然样本量略显不足,但其结果在很大程度上体现了指标的实用性和可操作性,并从这个侧面证明了2008年高考卷全国卷I和某省卷在多选题命题中存在的缺陷,同时提出了可控措施。本研究即在此基础,采用这套指标对2009年高考全国卷(I,Ⅱ)和某省卷阅读理解部分多选题进行评判,以检测在扩充样本量的情况下,指标是否依然能有效评测出试卷命题期间的可猜测性程度,并检验指标的效度和信度。为了与之保持一致,本研究同样采用专家评判一致的实证方法,通过统计软件SPSS16.0对评判专家的评判采用Pearson相关系数和肯德尔协同系数予以说明。通过对各卷进行单样本t检验描述各卷的可猜概率以及体现出的主要指标,并分析干扰项和答案项在可猜性方面的分布情况以测干扰项的干扰功能和答案项的构念效度。最后,文章在综合以上两个方面的分析结果并对评判指标使用频率进行统计的后下,有针对性的提出在命题过程中一些具体的可控措施。实验结果表明,在对适合的评判者使用这套指标进行足量的培训情况下,评判者的评判一致性能达到较为理想的状态;全国卷Ⅰ(2009,2010)和全国卷Ⅱ(2009,2010),以及某省卷在命题期间对选项可猜性的控制情况均存在一定的不足,其中全国卷Ⅱ(2009)的20道多选题,可猜题有11道,可猜概率到达55%,而全国卷Ⅱ(2009)的猜测概率也达到50%,全国卷Ⅰ(2010),可猜概率为30%,而全国卷Ⅱ(2010)猜测概率为40%。可见,为了提高试卷的效度和信度,在命题期间对多选题选项可猜性的控制十分必要。
其他文献
全面培养聋生的社会能力,包括工作能力、交往与合作能力、适应转换能力、批评和自我批评能力、口头和书面语表达能力、耐挫折能力和社会责任感等。全面培养聋生的社会能力以
<正> 所谓形式美原则,也就是形式美的基本法则。书刊版式设计的形式法则与绘画的构图法则有着极大的一致性。这可能因为它们在二维方式上具有共同点。在绘画的构图方面,自从
小报新闻通常被认为是坏新闻的同义词,其对煽情和丑闻的热衷、对低级趣味的迎合一直以来备受诟病,甚至一度被认为是对民主和政治参与的威胁。让批评者没有想到的是伴随了整个
目的探讨胸腔镜(video-assisted thoracic surgery,VATS)下肺癌根治术的术中配合及效果分析。方法回顾性分析2011年8月至2014年8月行肺癌根治术的患者,其中VATS组52例,男39例
以湖北汽车工业学院为例,通过问卷调研的方法对大学生的网购状况进行了综合分析。结果显示,大学生的网购状况与其消费能力并不匹配,且男女大学生在对网购的了解度、参与度和
《狼图腾》给我们奉献了一本绝妙的生态学教科书,它讲述了生物、人、狼、自然之间的故事。狼不仅是草原人民的图腾,也曾经是中华各族人民共同的古老图腾之一。《狼图腾》所反
<正>索尼在智能化客厅领域相对完整的布局,可以为国内厂商提供借鉴。从索尼2月20日PS4发布会可见,新一代游戏机将会有几点大的变化:升级的硬件将带来更强大的机能和更高清的
作为一个具有社会责任感的当代作家,托尼.莫里森一生不懈创作,从种族和血缘出发,关注社会现实和时代的症结,发挥"黑人"、"女性"和"作家"所赋予她的敏感与责任,通过不断地探索
目的对沙眼衣原体抗原的EIA法和胶体金检测卡(免疫层析法)进行对比分析评价。方法对150例男性、女性分泌物,男性尿液同时作EIA法和胶体金法检测沙眼衣原体抗原,用x2检验,两种
<正>建筑安装企业取得工程款项或应确认收入时,借记"银行存款"、"应收账款"等科目,贷记"主营业务收入"等科目;按其