英语口语测试诊断性评分量表的效度研究

来源 :北京外国语大学 | 被引量 : 2次 | 上传用户:IT_Yong
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
如何测试英语口语能力是外语测试领域一个长盛不衰的研究问题。近二十年间,国外学者不断对测试相关的理论基础与实施方法进行完善,一些大规模、标准化的口语能力测试也随即投入使用。随着测试理论的进一步发展,研究者们逐渐意识到了传统的口语测试中存在的问题:此类测试往往只能提供一个整体分数或笼统的等级描述用于反馈学生的英语口语能力,却无法详尽反映个体学习者在口语方面自身的优势与弱点。在此背景下,"诊断性测评"的概念开始走进测试领域研究者的视野,成为了一个新兴的研究方向。然而,目前国内关于英语口语能力的诊断性测评的研究为数寥寥。要开发一个有效、可行的诊断性测试,首先需要建立一个服务于诊断性测试的评分量表。因此,本研究从评分量表入手,对诊断性评分量表应用于传统口语测试环境中的效度进行深入探究。本研究根据以 Bachman&Palmer(1996)的口语交际能力模型(CLA)及 Alderson(2005)对诊断性测评的定义为理论基础,并参考了一些认可度较高的现有英语口语能力评分量表,设计了两份诊断性评分量表,这两份量表被用于同一项已有的口语考试任务。为实现对比分析,本研究采取控制变量法,两份量表在分数区间、评分维度、评分等级描述语的内容设置上保持一致,力图凸显量表本身的形式及每个量表提供的等级描述语的详细度这两个方面的差异。7名评分员依据这两份不同的评分量表,对30个口语录音文件分别进行评分。每个阶段的评分结束后,评分员填写一份相应的开放式问卷,表达他们对这一阶段使用的评分量表和自己的评分过程的理解。本研究采取量化与质性分析相结合的混合式研究方法,首先使用多侧面Rasch模型对评分的数据结果进行分析,进而对两份评分量表的效度进行说明与对比。然后,本研究运用主题分析法,将评分员的开放式问卷数据进行编码归纳,通过对评分行为的分析为两个量表的对比提供深入的解释。最后,本研究综合参考了量化与质性分析结果中发现的问题,分析对比了两份评分量表在效度层面上的差异,继而探究在传统的口语能力测试背景中使用诊断性测评方法的可行性。
其他文献
在我国,歌曲翻译最早出现在20世纪初。经历了开拓、繁荣、沉寂、复苏等阶段之后,到了 20世纪90年代,歌曲翻译受到的关注度越来越低,几乎到了鲜有人问津的地步。本文在开篇总
文章从对上党梆子起源的了解入手,整合了现阶段论文现状,采访上党梆子传承人,对上党梆子的传承人、拜师情况、伴奏乐器、声腔等,都进行了非常细致的了解,并对采访做了归纳总
目的:观察纳洛酮预防中枢性应激性溃疡的疗效。方法:101例中枢神经系统损伤的病人随机分为3组:纳洛酮组37例给予纳洛酮0.02mg·kg^-1,iv,q12h;奥美拉唑组给予奥美拉唑40mg,iv,
思想政治工作和以人为本的目的,是对员工即要做到心中有数,把握时机,掌握好度,又要塑造"四有"新人,激活每个人的积极性和创造性,在尊重人、理解人、关心人的工作氛围中,使团
瓦楞纸箱在加工前,需要合理、科学的确定其材质与各项物理指标,这是一项技术含量较高的工作,对大多数纸箱用户来说,都不具备这方面的专业知识,而一些中小型纸箱生产厂也都只停留在"老经验"上,缺乏科学理论与数据的支持,目前社会上习惯的传统做法是:1.纸箱用户拿一只旧的或他厂的纸箱,要求纸箱厂"就按这只样箱的材料做"。
本文通过创业教育研究的原因、长三角地区创业教育调研、加强学生的创业教育三方面的探索,重点突出中等职业学校要重视创业教育,旨在培养创业精神和自己创业能力。
模具是工业生产中的基础工艺装备,也是制造业中影响面广、使用量大的工业产品,一个国家制造业水平高低可以通过模具的技术水平的高低来衡量从目前来看,主要有三个因素(工期、
全球对发展中国家纺织业持续的关注和投资以及在这些国家企业间的竞争,导致了东西方最大的纺织厂商之间的一场危机。如今这场危机已发生了戏剧性的变化,朝着追求低成本竞争
一切伟大的事业都需要在承前启后、继往开来中向前推进.初心如磐,使命如山.在党的十九大引领全国人民满怀信心踏上新时代、新征程的历史时刻,肩负着开创新局面、展现新作为的
目的总结分析纵隔神经内分泌癌的CT表现,提高诊断准确性。方法回顾性分析20例经手术病理证实的纵隔神经内分泌癌的临床资料及CT表现。结果纵隔神经内分泌癌的患者多无明显特