普通话水平测试员的素质与测试信度

来源 :文教资料 | 被引量 : 0次 | 上传用户:guanyinchashe
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘 要: 作者针对在普通话水平测试过程中发现的一些问题,如测试员业务素质不高,缺乏必要的汉语语音理论知识及较强的听音、辨音、记音能力,或者工作态度不认真,导致测试信度不高,影响测试质量等进行分析,并提出建议。
  关键词: 普通话水平测试 测试员素质 测试信度
  
  普通话水平测试是对应试人员运用普通话所达到的标准程度的检测和评定。普通话的标准只有一个,普通话水平测试是用这把唯一的标准“尺子”对应试人的普通话水平进行测量。宋欣桥在《普通话水平测试中的评分差异》一文中针对等级中正常的非临界评分差异指出:一级,差异在0.9分以内。二级,差异在1.5分以内。三级,差异在2分以内。如果评分差异过大,超出这一正常范围,那么测试结果将会受到质疑,影响测试的信度。
  每每参加普通话水平测试,经常见到分数悬殊的情况。第一次合作的测试员往往要经过一个“磨合期”,分数才慢慢接近。“普通话的标准只有一个”,测试员心中的这把“尺子”应该是一样的,那为什么评分会有较大差异呢?经观察分析,我认为这与测试员的素质有很大关系,可以说测试员的素质直接影响到测试信度。
  测试员的素质主要应该包括业务素质和工作态度两个方面。国家语委颁发的《关于普通话水平测试管理工作的若干规定(试行)》(国语[1997]32号)对测试员提出了明确要求:熟悉推广普通话工作方针政策和普通话语音理论,掌握《汉语拼音方案》和常用国际音标,熟悉方言和普通话的一般对应规律,普通话口语水平达到一级,有较强的普通话水平测试能力和较丰富的测试工作经验,有高度的事业心、责任感和工作热情。然而现实情况并非如此。在参加培训的学员中,科班出身从事汉语教学与研究工作的内行较少,有的教理化,或在某些行政岗位工作。这些人虽然普通话说得标准,但缺乏必要的汉语语音理论知识及较强的听音、辨音、记音能力,即使通过了测试员资格考试,也会对普通话水平的测试质量有影响。有的测试员责任心不强,导致了测试结果信度的降低。
  测试员素质不高对测试质量的影响主要表现在以下几方面。
  一、字音错误、缺陷的漏判、误判
  首先,普通话水平测试作为一种口试形式,应试人发出的声音转瞬即逝,这就要求测试员能迅速捕捉应试人的发音特点,并对其做出准确及时的分析与评判。这一过程要求瞬间完成。训练有素的测试员的这种反应几乎是自动化的,不存在“思索”过程。如果测试员经验不足,或对评分标准不熟悉,对某一字音的评判有犹豫,耽误了时间,就会影响到对后面字词的听辨。特别是低分段考生,速度可能很快,但错误百出,根本不容测试员充分思考。第二题是双音节词连读,实际速度会更快,这就要求测评员注意力更集中。朗读项要同时考查应试人的方言语调、停顿不当等问题,说话项要同时考查说话人的语音面貌和词汇语法使用情况及自然流畅度,可能会顾此失彼,以致漏判。
  其次,有些测评员听辨语音能力不强,对有些语音现象不够敏感,也易造成漏判。例如,阴平调调值读成44,应该判缺陷,但测试员没有感觉到,从而漏判。
  再次,评分标准模糊,对所谓定性分析的认识不清,造成误判。如上声调,许多应试者在读单音节字词时读成半上,有的测试员判为错误,有的测试员判为缺陷,分值差别较大。根据对语音错误的描述,把“甲”读作“乙”才算错,那么这些读音应判缺陷,因为尽管调值不到位,毕竟还没有读成另外的音。如鼻化元音,如果对这一“定性”存在认识上的模糊,就易误判。
  最后,测试员个人的好恶、偏见也易影响评分。有些测试员对某些方音特别反感,把缺陷判成错误,造成评分过严;而对那些能容忍的方音则视而不见,造成评分过松。
  虽然错判、漏判一个字音只有0.2、0.1或0.05分的差异,但是量的积累会产生质的变化。
  二、对朗读项语调偏误等视程度扣分把握不准,造成评分误差
  《大纲》规定:“语调偏误,视程度扣0.5分、1分;声母或韵母的系统性语音缺陷,视程度扣0.5分、1分、2分;停连不当,视程度扣0.5分、1分、2分;朗读不流畅(包括回读),视程度扣0.5分、1分、2分。”这种描述,本身有其模糊性。如果在“定量”的基础上“定性”,评分就会多一些依据、会更客观些。但是《大纲》对这一项没有更详细的说明,给测试员评分带来困难。我参加测试员培训班学习,在该项测评练习时,全体学员对同一个例子进行分析评分,有扣2分的,也有扣1分的,甚至有扣0.5分的。在实际测试过程中,有些测试员只是凭感觉评分,或者以各自的经验为参照,主观随意性大,宽严尺度不一。仅此一项,就可能出现较大的差距。
  三、对说话项语音面貌的评分归档把握不准
  说话项是考查应试人在没有文字凭借的情况下说普通话的水平,重点测查语音标准程度、词汇语法规范程度和自然流畅程度。此项成绩占总分的30%,而我省把第三项“选择和判断题”删去,其10分的分值加在了说话语音面貌一栏。这样,仅语音面貌一栏就占去30分。因此,对语音面貌评分的正确把握相当重要,而测试员对这一项的把握也最感困难。首先是对“有方音但不明显”、“方音比较明显”、“方音明显”的理解有分歧。我在考核验证班学习时,对一个案例印象很深:放完一个考生的说话录音后,各自打分。多数测试员认为该考生语音面貌不错,就扣去4分。最后老师总结说他方音比较明显。理由是一些词轻重音格式不对,应归入三至四档,应扣5—6分。这是各位测试员评分分歧最大的一项。一些测试员只了解一些评分规则,缺少实践经验,一遇上具体问题就犹豫不决,对自己信心不足,“参考”其他测试员的评分,使自己的评分失去独立性。还有一些测试员凭“经验”打分或受“经验”的负面影响,仅凭几句话就给出一个分数,对字音失误缺少统计、对语音失误类型和方言色彩及方音成分缺乏分析。这些都是造成此项评分错档、出现重大失误的常见原因。
  此外,在实际测试工作中,任何一项测试,要想得到可信的评分,就必须注意保持测验的必要长度(所谓测验的长度,就是测验项目的多少,测验项目越全面、越多,测验的可靠性就越高)。应保证说话的足够长度,只有这样,应试人真实的语音面貌才可能全面地展现出来,使评分更客观、公正,从而提高测试的信度。
  测试工作专业性强,测试员一方面要努力加强学习,开阔视野,提高自己的测评能力,避免技术层面上的失误,另一方面要认真对待,避免非技术层面上的偏差,使评分尽可能客观公正。
  普通话测试管理部门也要加大对测试员的监管力度,坚持后续培训,定期考核,开展测试理论研究,且在每次测试前统一测试标准,缩小误差,提高测试信度。
  
  参考文献:
  [1]国家语言文字工作委员会普通话培训测试中心编制.普通话水平测试实施纲要.北京:商务印书馆,2006.
  [2]国家语言文字工作委员会普通话培训测试中心,《语言文字应用》编辑部合编.普通话水平测试的理论与实践.北京:商务印书馆,1998.
其他文献
轮回 不是深夜,我不敢打扰你 所有智慧的以及灵性的万物 我不愿苍白的过活 生命的远处多么迷茫 浑浑噩噩就是常态呀 在时间未开始之前 我就在听从呼吸铸就的传说 我一个人在深
如果每个人都是一颗星星的话,那么在这个浩瀚无垠的宇宙中,我和他本应该在各自的轨道上运行着。然而,我们却不期而遇了一一同桌。虽然是同桌,我们为什么一碰头就争个不休、闹个不
——这个世界,不是因为美好太少,而是因为我们太习以为常而不知珍惜。7岁无邪:风总是温柔地吹着,裙裾皱出好看的纹路。外婆家的大黄狗安静地卧在大门口。傍晚的夕阳印在它黝黑的
不见,最好流云不懂花的愁天不懂海的蓝那是照过面的.陌生
用硅粉、二氧化硅和石墨粉作原料,在无催化剂的条件下,在1400℃下用高温化学气相反应法制备了碳化硅纳米线,并用高分辨扫描电镜观察了所得碳化硅纳米线的形貌.所得碳化硅纳米线直径为100~500nm,长度可达几百微米.还提出了描述碳化硅纳米线的生长机理。
“数学一百分,英语一百分……不错!”妈妈翻开了我的成绩册,笑眯眯地看着我的成绩说。我在一旁听到妈妈的表扬,一点也不感兴趣。
本文以《项羽之死》为出发点,将初高中学过的历史文学人物之死重新审视,体现高中语文探究的特点:联通知识点、品味细节处、提升精气神。探究的方法:追问、牵连;先教师探究示例,
看天气预报,得知今天会下雨;看门前的蚂蚁,得知今天会下雨。起先,万里无云,一阵刺骨的寒风吹来,在骄阳似火的夏天竟然有冷风,这一不寻常的现象意味必有大事发生。果不其然,乌
研究了铸态、挤压态及热处理态AZ31B镁合金的力学性能和耐蚀性能,选出性能最优的AZ31B镁合金,植入动物下颌骨处进一步研究其在体内的降解行为及其降解产物对动物体的影响。研究结果表明,AZ31B镁合金经过挤压和固溶时效处理可以提高其力学性能和耐腐蚀性能。将处理后的AZ31B镁合金植入兔下颌骨后发现,材料降解未对动物体造成不良影响,并且降解过程不会影响下颌骨骨折固定的稳定性。因此,可降解AZ31B镁
采用水热法制备了钛盐纳米管,并用TEM、XRD对其进行了表征.结果表明,纳米管是在洗涤过程中形成的,管径在5~30nm之间,管长约为0.1~1μm.纳米管具有不同于锐钛矿型的钛盐的结构;