论文部分内容阅读
摘要:广西已普遍进行大学英语口语测试,但是存在以下问题:学生口语水平低、考试规模大、评分标准不够科学、客观,因此在设计口语测试时要充分考虑到这些现状。对口语测试中的问题进行分析,并提出对策,以便能够设计更科学的口语测试,提高效度和信度,促进大学英语口语教学。
关键词:口语测试;测试形式;命题形式;评分标准
中图分类号:G4文献标识码:A文章编号:16723198(2013)22015402
随着大学英语教学改革的不断深入,口语教学愈加受到重视,特别是自1999年大学英语四、六级考试开始有口语测试以来,国内各大院校基本都在大学英语教学中加入了口语测试。广西虽然是少数民族地区,但是也非常重视口语教学,具体体现在各院校的学期考试不再像以往只有卷面考试,而是增加了口语测试。然而,由于少数民族地区的特点,例如学生普遍口语水平不高、师资不足、设备短缺等,口语教学还有一些不尽如人意的地方。相对综合性大学,工科院校口语教学的难度更大。本文分析广西工学院和桂林理工大学的口语测试现状,旨在改进口语测试,提高效度和信度,加大语言测试对教学的正面影响。
1广西工科院校口语测试现状
广西工学院和桂林理工大学都是对2003级学生开始进行口语测试,口语测试按10分计,在最终的总评成绩中占10%。经过几年的探索和实践,口语测试的考试形式、命题形式、评分标准不断地改进和提高。
1.1口语测试形式
最初的口语测试形式比较随意,提出测试的理念只是为了促进学生加强口语练习,所以口语测试甚至没有统一的形式,有的班是背诵课文,有的班是作对话,有的班是问答。评分也没有规定标准,老师评分的主观性很强。随着对口语测试理论认识的加深,计算机设备的增加,特别是为了提高口语测试的信度和效度,现在两校采用的是半直接型口试,又称录音口试(recording oral test),即将考题事先录制在磁盘上,考生针对磁盘上的试题进行口头应答。研究表明这种半直接型口试既能保留间接型口试(笔试型口试)的信度,又能保留直接型口试(面对面测试)的交际特点和效度,在半直接型口试中,考试程序、考试材料、考官水平、评估过程等都可得到适当的控制,并且在实际操作上也有明显优势。
录音口试比较适合大规模考试,特别是少数民族地区师资力量不足,每个大学英语教师的教学任务都很重,大多数教师要讲授四个班的课程,但是录音口试难以测试考生的交互能力,直接口试交互性强,但很难避免考官主观行为的影响。有的研究发现考生更喜欢直接口试,有的显示考生更愿意参加录音口试。如何能将两者的优势都发挥出来,这就需要更高级的计算机模拟及人工智能,实现人机交流的口试形式,既能加强交互性,提高效度,又能减少主观性,提高信度,设计出理想的口语测试形式。
1.2命题形式
在采用录音口试后,口试题型就统一起来,考虑到学生每个阶段的水平不一样,每个学期的题型也不相同。由于少数民族地区学生普遍语音较差,第一学期主要考查学生语音提高的情况,所采用的题型是课文朗读和回答问题。课文朗读即学生朗读从学过的课文中抽取的一些段落,回答问题就是回答一些与日常生活有关的问题。与非少数民族地区的高校相比,这样的题型过于简单,但是学生的口语水平使得最初的口语测试不得不采用比较简单的形式。学生的口语水平将在以后的章节作进一步的分析。
经过一段时间的学习,学生的口语能力得到提高,考试题型也随即变化,增加了两人对话,小组讨论。这样的命题形式更接近交际语言测试模式。世界语言测试理论的发展大致经历了以下四个阶段:(1)潜科学时期;(2)心理测量——结构主义时期;(3)心理语音学——社会语言学时期;(4)交际语言测试时期。后三个阶段分别对应三种语言测试模式:心理测量——结构主义模式、心理语言学——社会语言学模式、交际语言测试模式。与另外两种模式相比,交际语言测试模式被认为“直接测试能力,效度高,命题简便,测试真实的综合技能,积极促进教学”。因此,我们的命题形式尽量采用交际语言测试模式。
1.3评分方法及标准
目前各大型口语测试所采用的评分标准主要有分解评分法(analytic scoring)、整体评分法(holistic scoring)和任务分项评分法(item analytical scoring)。第一种评分方法是指评分者从考生口语水平的不同维度分别对其口语表达能力进行评分,然后根据每个维度的得分算出总分。第二种评分方法是指评分者按一定的标准,根据自己对考生口语水平的总体印象进行评分。第三种评分方法就考生对每项口试任务的完成情况(如内容和语言表达情况等)分别评分,然后再根据每个任务的得分算出口试总分。
我们采用的主要是整体评分法,即老师在听完录音后根据总体印象给出分数,但是每个阶段有不同的标准。在第一阶段的口语测试中,侧重的是学生的语音语调,因此,语音语调占总分的50%,回答问题的内容占50%。但这个阶段的评分标准没有考虑语言的得体性、真实性、交际功能。高级阶段的口语测试采用交互式口试的形式,评分标准侧重于考生的语言交际能力。
2问题与对策
口语测试对口语教学有着积极的反拨作用,但是由于少数民族工科院校的特点,我们的口语测试还亟待提高。
2.1学生英语学习情况
广西是一个少数民族聚集的地区,有各种不同的少数民族方言,我们的学生主要来自广西各个县级及乡级中学,城市的生源不多,学生来大学之前说着各种各样的方言,这自然會影响到他们英语口语的语音语调。还有些地方的学生初中才开始学英语,接受的是应试教育,很少训练口语。有学生反映在中学学了六年英语,从来没开口读过。他说在中学上课时,老师主要讲解语法,背单词,做试题,根本没练过口语,因此他的语法掌握得很好,语言点都知道,就是不会说,典型的哑巴英语,这样的现象在我们的学校很普遍。还有的学生连最简单的单词都读错,音节多一点的单词就不会读。总的来说,少数民族地区学生的英语口语水平普遍不高。 面对这样的现状,我们主要从两个方面入手解决,一是加强口语教学。从基本的语音语调抓起,增补音标知识,纠正错误发音,练习单词拼读,学习日常生活会话并加以实践,要求学生课内课外都要进行口语练习。二是通过口语测试来促进学生的口语学习。中学之所以不重视口语是因为没有口语考试,以考促学也有积极的一面。但是,考试的任务要根据学生的口语水平制定,命题形式应该与学习过程相匹配,循序渐进。
工科院校有一个特点,就是专业课学习任务比较重。有些专业的学生大一就要实习,例如资环的学生要到野外,土木的学生要下工地,机械的学生要去工厂,有的专业学生周末都用来做实验,有的要画图,总之,专业课占用了学生大部分的时间,能用来学习英语的时间很少。针对这情况,要狠抓早读和晚听,强调听说能力的重要性。
2.2口语测试的真实性
外语界讨论的是“考试语言”和“真实语言”之间的区别,考生在测试中的表现与真实生活中的交谈是否相同。有一种观点认为,口语测试本来就不必与日常会话相同,它本身就是一种交际言语行为。将测试与现实环境下的谈话情况进行比较,实际上是考查口语测试的真实性问题。一方面,由于口试的目的在于推断考生在真实环境下口语能力的使用情况,为提高测试效度就要使其与真实语言使用情况更加接近,另一方面,由于口试归根结底是考试而不是日常会话,它永远不可能摆脱考试环境所赋予的某些特征。根据以上的理论可以判定我们的口语测试完全属于考试语言,真实性不高。
首先,学生在参加考试前都是有准备的。由于少数民族地区学生口语水平不高,在考试前,老师会给出一些范围让学生提前准备,例如与考试内容有关的主题、要讨论的话题,学生就把要讲的内容背下来,考试时就背诵事先准备好的内容。这样的考试是较为流于形式,没有完全达到口语测试的目的。
其次,口语测试的交互性不够。交互是一种相互交流、双向沟通的能力。由于是录音口试,考官没有参与到测试中,考生只是按照计算机的指示进行考试步骤,因此考官并不能了解考生的交互能力。虽然高级阶段增加了对话及小组讨论,有研究表明小组讨论比一对一的考试形式更自然、考生焦虑程度较低,但是由于学生事先准备,多以背诵为主,因此没有表现出真正的交互能力。
因为大学英语口试规模大,很难进行面对面的直接口试,所以要提高口语测试的真实性和交互性,只能靠计算机界和外语界携手努力,提高计算机模拟和人工智能化。
2.3评分标准及考官培训
研究认为整体评分标准是操作性较强、较易掌握、符合大学英语大面积口试实际、效度和信度较高的评分标准,但在实际使用中一定要对评分员加以培训。我们所采用的是整体评分标准,但是在评分过程中却比较随意,因为整体评分标准是要求评分者按一定的标准给考生评分,这个“一定的标准”比较难掌握。大多数老师是根据第一印象进行总体评分,因此评分过程的随意性很强,更多的是依靠经验评分。要解决这一问题,需要制定统一的评分标准,并且将标准量化和细化,老师掌握了评分标准后再进行评分。但是目前还缺乏一个完整的理论模型来解释考生、主考官、测试形式、测试任务、评分准则、评分环境等各种因素与评分员、评分行为之间的相互作用关系。
国际和国内口语测试的考官都是经过培训才能上岗,例如托福口试,雅思口試、剑桥英语口试,国内的大学英语四、六级口试、公共英语等级口试等,这些口语测试的考官都是经过严格、正规的培训。如果所有的大学英语教师都参加这样的培训是不太现实的,但是基本上每个学校都有老师去参加大学英语四、六级,或者剑桥商务英语口试考官的培训,可以让这些老师对未培训过的老师进行辅导,或者请一些培训教师来讲学,使老师们在评分时尽量提高客观性和科学性,减少主观性和随意性。
3结语
口语测试研究的主要问题包括测试的真实性、测试的参与者、测试形式、测试任务、评分准则及其实施等。口语测试的主观性及多种影响因素使得设计科学、可靠、有效的口语测试更为困难。而少数民族地区工科院校的口语测试除了要遵循一般口语测试的原则外,还应结合本校的特点设计测试形式、测试任务和评分标准。测试的目的是考查学生的语言应用能力,更是为了促进大学英语口语的教学,提高学生的口语水平,加大测试对教学积极的反拨作用。
参考文献
[1]熊敦礼,陈玉红等.大学英语大规模录音口语测试研究[J].外语教学与研究,2002,(4):283287.
[2]杨莉芳.近二十年口语测试研究中存在的主要问题[J].外语教学,2006,(1):4246.
[3]Heaton,J.B.Writing English Language Tests [M].London:iLongman Group,1991:1520.
[4]戴曼纯.现代语言测试发展:理论与问题[J].湖南大学学报,1993,(3):3242.
[5]吕长竑,宋冰等.口语测试评分标准比较研究[J].外语教学与研究,2008,(6):440446.
[6]陶丹玉.爱尔兰之行见证交互英语口语测试(OTIE)[J].现代外语,2006,(2):215217.
[7]Bonk,W. J. & G. J. Ockey.A manyface Rasch analysis of the second language group oral discussion task[J].Language Testing,2003,(20):89110.
[8]Upshur,J. & C. E. Turner.Constructing rating scales for second language tests[J].English Language Teaching Journal,1995,(49):312.
关键词:口语测试;测试形式;命题形式;评分标准
中图分类号:G4文献标识码:A文章编号:16723198(2013)22015402
随着大学英语教学改革的不断深入,口语教学愈加受到重视,特别是自1999年大学英语四、六级考试开始有口语测试以来,国内各大院校基本都在大学英语教学中加入了口语测试。广西虽然是少数民族地区,但是也非常重视口语教学,具体体现在各院校的学期考试不再像以往只有卷面考试,而是增加了口语测试。然而,由于少数民族地区的特点,例如学生普遍口语水平不高、师资不足、设备短缺等,口语教学还有一些不尽如人意的地方。相对综合性大学,工科院校口语教学的难度更大。本文分析广西工学院和桂林理工大学的口语测试现状,旨在改进口语测试,提高效度和信度,加大语言测试对教学的正面影响。
1广西工科院校口语测试现状
广西工学院和桂林理工大学都是对2003级学生开始进行口语测试,口语测试按10分计,在最终的总评成绩中占10%。经过几年的探索和实践,口语测试的考试形式、命题形式、评分标准不断地改进和提高。
1.1口语测试形式
最初的口语测试形式比较随意,提出测试的理念只是为了促进学生加强口语练习,所以口语测试甚至没有统一的形式,有的班是背诵课文,有的班是作对话,有的班是问答。评分也没有规定标准,老师评分的主观性很强。随着对口语测试理论认识的加深,计算机设备的增加,特别是为了提高口语测试的信度和效度,现在两校采用的是半直接型口试,又称录音口试(recording oral test),即将考题事先录制在磁盘上,考生针对磁盘上的试题进行口头应答。研究表明这种半直接型口试既能保留间接型口试(笔试型口试)的信度,又能保留直接型口试(面对面测试)的交际特点和效度,在半直接型口试中,考试程序、考试材料、考官水平、评估过程等都可得到适当的控制,并且在实际操作上也有明显优势。
录音口试比较适合大规模考试,特别是少数民族地区师资力量不足,每个大学英语教师的教学任务都很重,大多数教师要讲授四个班的课程,但是录音口试难以测试考生的交互能力,直接口试交互性强,但很难避免考官主观行为的影响。有的研究发现考生更喜欢直接口试,有的显示考生更愿意参加录音口试。如何能将两者的优势都发挥出来,这就需要更高级的计算机模拟及人工智能,实现人机交流的口试形式,既能加强交互性,提高效度,又能减少主观性,提高信度,设计出理想的口语测试形式。
1.2命题形式
在采用录音口试后,口试题型就统一起来,考虑到学生每个阶段的水平不一样,每个学期的题型也不相同。由于少数民族地区学生普遍语音较差,第一学期主要考查学生语音提高的情况,所采用的题型是课文朗读和回答问题。课文朗读即学生朗读从学过的课文中抽取的一些段落,回答问题就是回答一些与日常生活有关的问题。与非少数民族地区的高校相比,这样的题型过于简单,但是学生的口语水平使得最初的口语测试不得不采用比较简单的形式。学生的口语水平将在以后的章节作进一步的分析。
经过一段时间的学习,学生的口语能力得到提高,考试题型也随即变化,增加了两人对话,小组讨论。这样的命题形式更接近交际语言测试模式。世界语言测试理论的发展大致经历了以下四个阶段:(1)潜科学时期;(2)心理测量——结构主义时期;(3)心理语音学——社会语言学时期;(4)交际语言测试时期。后三个阶段分别对应三种语言测试模式:心理测量——结构主义模式、心理语言学——社会语言学模式、交际语言测试模式。与另外两种模式相比,交际语言测试模式被认为“直接测试能力,效度高,命题简便,测试真实的综合技能,积极促进教学”。因此,我们的命题形式尽量采用交际语言测试模式。
1.3评分方法及标准
目前各大型口语测试所采用的评分标准主要有分解评分法(analytic scoring)、整体评分法(holistic scoring)和任务分项评分法(item analytical scoring)。第一种评分方法是指评分者从考生口语水平的不同维度分别对其口语表达能力进行评分,然后根据每个维度的得分算出总分。第二种评分方法是指评分者按一定的标准,根据自己对考生口语水平的总体印象进行评分。第三种评分方法就考生对每项口试任务的完成情况(如内容和语言表达情况等)分别评分,然后再根据每个任务的得分算出口试总分。
我们采用的主要是整体评分法,即老师在听完录音后根据总体印象给出分数,但是每个阶段有不同的标准。在第一阶段的口语测试中,侧重的是学生的语音语调,因此,语音语调占总分的50%,回答问题的内容占50%。但这个阶段的评分标准没有考虑语言的得体性、真实性、交际功能。高级阶段的口语测试采用交互式口试的形式,评分标准侧重于考生的语言交际能力。
2问题与对策
口语测试对口语教学有着积极的反拨作用,但是由于少数民族工科院校的特点,我们的口语测试还亟待提高。
2.1学生英语学习情况
广西是一个少数民族聚集的地区,有各种不同的少数民族方言,我们的学生主要来自广西各个县级及乡级中学,城市的生源不多,学生来大学之前说着各种各样的方言,这自然會影响到他们英语口语的语音语调。还有些地方的学生初中才开始学英语,接受的是应试教育,很少训练口语。有学生反映在中学学了六年英语,从来没开口读过。他说在中学上课时,老师主要讲解语法,背单词,做试题,根本没练过口语,因此他的语法掌握得很好,语言点都知道,就是不会说,典型的哑巴英语,这样的现象在我们的学校很普遍。还有的学生连最简单的单词都读错,音节多一点的单词就不会读。总的来说,少数民族地区学生的英语口语水平普遍不高。 面对这样的现状,我们主要从两个方面入手解决,一是加强口语教学。从基本的语音语调抓起,增补音标知识,纠正错误发音,练习单词拼读,学习日常生活会话并加以实践,要求学生课内课外都要进行口语练习。二是通过口语测试来促进学生的口语学习。中学之所以不重视口语是因为没有口语考试,以考促学也有积极的一面。但是,考试的任务要根据学生的口语水平制定,命题形式应该与学习过程相匹配,循序渐进。
工科院校有一个特点,就是专业课学习任务比较重。有些专业的学生大一就要实习,例如资环的学生要到野外,土木的学生要下工地,机械的学生要去工厂,有的专业学生周末都用来做实验,有的要画图,总之,专业课占用了学生大部分的时间,能用来学习英语的时间很少。针对这情况,要狠抓早读和晚听,强调听说能力的重要性。
2.2口语测试的真实性
外语界讨论的是“考试语言”和“真实语言”之间的区别,考生在测试中的表现与真实生活中的交谈是否相同。有一种观点认为,口语测试本来就不必与日常会话相同,它本身就是一种交际言语行为。将测试与现实环境下的谈话情况进行比较,实际上是考查口语测试的真实性问题。一方面,由于口试的目的在于推断考生在真实环境下口语能力的使用情况,为提高测试效度就要使其与真实语言使用情况更加接近,另一方面,由于口试归根结底是考试而不是日常会话,它永远不可能摆脱考试环境所赋予的某些特征。根据以上的理论可以判定我们的口语测试完全属于考试语言,真实性不高。
首先,学生在参加考试前都是有准备的。由于少数民族地区学生口语水平不高,在考试前,老师会给出一些范围让学生提前准备,例如与考试内容有关的主题、要讨论的话题,学生就把要讲的内容背下来,考试时就背诵事先准备好的内容。这样的考试是较为流于形式,没有完全达到口语测试的目的。
其次,口语测试的交互性不够。交互是一种相互交流、双向沟通的能力。由于是录音口试,考官没有参与到测试中,考生只是按照计算机的指示进行考试步骤,因此考官并不能了解考生的交互能力。虽然高级阶段增加了对话及小组讨论,有研究表明小组讨论比一对一的考试形式更自然、考生焦虑程度较低,但是由于学生事先准备,多以背诵为主,因此没有表现出真正的交互能力。
因为大学英语口试规模大,很难进行面对面的直接口试,所以要提高口语测试的真实性和交互性,只能靠计算机界和外语界携手努力,提高计算机模拟和人工智能化。
2.3评分标准及考官培训
研究认为整体评分标准是操作性较强、较易掌握、符合大学英语大面积口试实际、效度和信度较高的评分标准,但在实际使用中一定要对评分员加以培训。我们所采用的是整体评分标准,但是在评分过程中却比较随意,因为整体评分标准是要求评分者按一定的标准给考生评分,这个“一定的标准”比较难掌握。大多数老师是根据第一印象进行总体评分,因此评分过程的随意性很强,更多的是依靠经验评分。要解决这一问题,需要制定统一的评分标准,并且将标准量化和细化,老师掌握了评分标准后再进行评分。但是目前还缺乏一个完整的理论模型来解释考生、主考官、测试形式、测试任务、评分准则、评分环境等各种因素与评分员、评分行为之间的相互作用关系。
国际和国内口语测试的考官都是经过培训才能上岗,例如托福口试,雅思口試、剑桥英语口试,国内的大学英语四、六级口试、公共英语等级口试等,这些口语测试的考官都是经过严格、正规的培训。如果所有的大学英语教师都参加这样的培训是不太现实的,但是基本上每个学校都有老师去参加大学英语四、六级,或者剑桥商务英语口试考官的培训,可以让这些老师对未培训过的老师进行辅导,或者请一些培训教师来讲学,使老师们在评分时尽量提高客观性和科学性,减少主观性和随意性。
3结语
口语测试研究的主要问题包括测试的真实性、测试的参与者、测试形式、测试任务、评分准则及其实施等。口语测试的主观性及多种影响因素使得设计科学、可靠、有效的口语测试更为困难。而少数民族地区工科院校的口语测试除了要遵循一般口语测试的原则外,还应结合本校的特点设计测试形式、测试任务和评分标准。测试的目的是考查学生的语言应用能力,更是为了促进大学英语口语的教学,提高学生的口语水平,加大测试对教学积极的反拨作用。
参考文献
[1]熊敦礼,陈玉红等.大学英语大规模录音口语测试研究[J].外语教学与研究,2002,(4):283287.
[2]杨莉芳.近二十年口语测试研究中存在的主要问题[J].外语教学,2006,(1):4246.
[3]Heaton,J.B.Writing English Language Tests [M].London:iLongman Group,1991:1520.
[4]戴曼纯.现代语言测试发展:理论与问题[J].湖南大学学报,1993,(3):3242.
[5]吕长竑,宋冰等.口语测试评分标准比较研究[J].外语教学与研究,2008,(6):440446.
[6]陶丹玉.爱尔兰之行见证交互英语口语测试(OTIE)[J].现代外语,2006,(2):215217.
[7]Bonk,W. J. & G. J. Ockey.A manyface Rasch analysis of the second language group oral discussion task[J].Language Testing,2003,(20):89110.
[8]Upshur,J. & C. E. Turner.Constructing rating scales for second language tests[J].English Language Teaching Journal,1995,(49):312.