论文部分内容阅读
大多数关于教育测试与语言测试的专著对诊断性考试都有所介绍,但是对诊断性考试的开发和效度进行深入探讨的研究还很欠缺。在现有的诊断性语言测试中,DIALANG是唯一一个通过标准化语言测试系统为考生提供详细的诊断性反馈信息的考试。然而DIALANG主要采用客观性的题型测量考生的语言领会能力,不是语言表达能力,如口头表达和短文写作等。鉴于诊断性考试理论与实证研究的相对缺乏,我们需要开展更多的研究以更好的了解诊断性考试的特征及其所提供的诊断性反馈信息对教学和学习的影响,特别是需要探讨在中国大学英语教学环境中应用诊断性考试的可行性及其有效性。本研究开展了大学英语口语诊断性测试的开发和效度论证,调查了该考试所提供的诊断性反馈信息对大学英语教学与学习的影响。本研究对诊断性考试的相关研究,尤其是对诊断性英语口语测试的开发与实施具有重要的参考价值。 基于Bachman(1990)的交际语言能力模型,Bachman和Palmer(1996)的考试开发与效度研究框架以及Alderson(2005)关于诊断性语言测试开发的研究,作者依据本研究所提出的流程框架设计了大学英语口语诊断性测试范型卷并论证了该考试的效度。作者在一所全国重点大学开展了实验,该实验由三个阶段构成,历时8个星期。通过诊断性考试,问卷调查和访谈,作者从实验组和对比组两组考生中收集了多种数据。通过对这些数据的分析,作者验证了大学英语口语诊断性测试的效度并调查了考试的反馈信息对大学英语教学和学习的影响。通过定量分析和定性分析相结合的研究方法,本研究得出了以下主要实验结果。 首先,本研究对200名大学生和30名大学英语教师进行了需求分析,调查结果显示大部分学生(94.8%)对他们当前的英语口语水平都不满意,而且大学英语口语教学和学习还没有得到足够的重视。因此为了进一步提高大学英语老师对诊断性考试对教学与学习的重要性的认识,开发大学英语口语诊断性测试势在必行。 其次,通过对交际语言能力模型以及言语生成模型的回顾,作者以Fulcher(2003)的口语测试构念框架(aframework for describing the speaking construct)和Luoma(2004)的构念规范(construct specifications)为参考确定了大学英语口语诊断性测试的构念。考试构念的定义为选择考试任务,设计评分标准和反馈信息等提供了重要的指导。 再次,作者选取了五种口语测试任务,组建了两套范型卷。其中,朗读(ReadingAloud)属于结构型任务,个人陈述(Individual Presentation),信息转换(InformationTransfer),交换信息讨论(Information Gap)以及角色扮演(Role Play)都属于开放型任务。作者为该考试制定了十个分项评分标准,每个评分标准分成五个评分等级。为了充分实现大学英语口语诊断性测试的诊断功能,作者以十个分项评分标准为参数制定了十项反馈信息。测试任务的选择,评分标准以及诊断性反馈信息的制定对于确保大学英语口语诊断性测试的信度和效度至关重要。 第四,对实验数据的定性和定量分析结果表明大学英语口语诊断性测试具有较高的信度和效度。该考试的评分者内信度(intra-rater reliability)和评分者之间的信度(inter-rater reliability)分别为0.966和0.884.因子分析的结果为该考试的构念效度提供了证据。通过因子分析提取了3个主要因子,这三个因子解释了78.69%的考试分数差异。通过对考试设计阶段的考试规范的制定以及对第三套大学英语口语诊断性测试的内容分析为该考试的内容效度进一步提供了证据。学生的第一套大学英语口语诊断性测试成绩与他们的口语能力自测成绩(r=.835),以及英语老师对他们口语能力的评价(r=.626)之间的相关证实了该考试具有较好的效标关联效度。对考试评价问卷的分析表明大多数学生对该考试的设计以及反馈信息的有用性都持肯定态度,这些都证明了该考试具有一定的表面效度。通过对实验组学生成绩变化的分析以及对两名在实验期间口语水平提高最快的学生的个案分析都证实了该考试具有较好的结果效度。 最后,本研究完善了为诊断性考试的开发和效度论证所设计的流程框架。该流程框架详细描绘了反馈信息的制定以及探讨反馈信息对英语教学与学习的影响的方法。 本文对诊断性测试研究的理论贡献主要体现在探讨和定义了大学英语教学中的英语口语能力构念。以大学英语口语诊断性测试的开发和效度研究为依据所建立的流程框架为大学英语教师开发和实施诊断性考试提供了参考模型。