论文部分内容阅读
[摘要]本研究是建立在“2009年国内考生统计特征数据库”的基础上,通过对“初中等考生数据库”和“高等考生数据库”的介绍和相关数据统计分析,我们发现:HSK考生的母语背景、职业类型、考试目的、专业分布以及对听力理解的评价等都会对HSK的命题和发展产生不同程度的影响。这些发现会为今后的HSK研发和实施提供决策性的参考,同时间接地为对外汉语事业提出一些数据性的建议。
[关键词]HSK考生数据库统计特征初中等高等
一、引言
中国汉语水平考试(HSK)是为测试母语非汉语者的汉语水平而设立的国家级标准化考试。在过去成长的二十多年中,HSK业已成为国内外有着广泛影响的汉语水平测量工具,先后有不少的学者针对HSK考试的效度、信度等问题进行过若干理论或实证方面的研究(如柴省三,2002;李慧,2000;郭树军,1988;张凯,2004等)。作为一种汉语能力考试,HSK与国内外颇具影响的大规模标准化语言测试(如TOEFL、CET、IELTS等)相比具有不少的共性。一方面,要保证其测验分数的解释具有较高的效度,必须对目标考生团体的统计特征,比如应试目的、母语背景、年龄结构、学业修养以及语言习得时间等方面进行尽可能详细的刻画,否则测验内容的界定以及测验结果的解释或使用就失去了参照的基础;另一方面,为了保证测验设计期望测量的目标考生与实际考生的统计特征具有较高的吻合行,针对一个既有的考试,研发人员还有必要对考生团体的结构特征进行统计分析,以获取测验解释或分数使用的效度证据。然而,由于受种种条件的限制,迄今为止,专门针对HSK目标考生团体的统计特征的大规模问卷调查研究尚不多见。
鉴于此,本文将以2009年国内HSK考生为调查目标,将问卷调查内容嵌入HSK报名表中,要求考生在报考HSK时认真填写相应的调查信息,然后将所有考生的有效问卷信息按照统一的规范建立考生数据库。这种数据采集方式既可以保证考生问卷填写的真实性,又可以提高信息采集的效率,因而数据的真实性也得到相应的保障。最后通过对考生报名表及基于报名表建立的数据库的介绍,着重从考生的五个侧面(母语背景、职业状况、考试目的、专业分布、对影响听力理解因素的评价)入手进行统计和分析,从而得出一些较有价值的统计证据,以期为今后的HSK研发和实践提供一定的借鉴。
二、考生数据库介绍及统计结果
迄今为止,汉语水平考试中心已经为1632377名国内外考生提供了这样的规范性考试及成绩报告。但是面对如此庞大的考生群体,我们只能将有限的人力物力投入到2009年国内HSK考生(包括4次初中等和2次高等,详见表1)的数据库建设上。
表1:2009年国内HSK考生人数统计(单位:个)
为了方便此次数据的录入和统计,我们分别设计了初中等和高等两种报名表。在参考HSK有关研发专家建议的基础上,专门设计了一份调查问卷。问卷内容分为两个部分:第一部分主要包括考生的若干生理、自然及社会属性方面的信息,比如出生日期、母语背景、国籍、性别、职业以及大学所学专业等,这些信息相对稳定或具有一定的静态性;第二部分则主要包括考生汉语习得时间、应考目的、对汉语水平的自我评价以及对HSK听力理解考试若干影响因素的个人评价等,这些信息属于考生的主观性评价,具有一定的动态性。为了保证填写信息的准确性,我们把问卷调查内容嵌入到HSK报名表中。在考试结束后,按考试类别将上述信息分别录入“HSK初中等考生数据库”(以下简称“库1”)和“HSK高等考生数据库”(以下简称“库2”)。这样既可以只针对考生数据库进行若干统计分析,也可以通过考生序号与考试成绩库建立相应的链接,从而进行考试成绩方面的深度数据挖掘,亦或进一步进行考试效度方面的研究。
(一)报名表及数据库的介绍
初中等和高等报名表只有颜色之分,内容基本一致,都大体分为三大部分,即:报名信息、静态信息和动态信息。我们的数据库是根据后面两部分建立起来的,即:“库1”和“库2”。(详见图1)该数据库共列有12个字段,分别是:考点、考生序号、出生日期、职业、母语、时间1(代表在己国学习汉语时间)、时间2(代表在中国学习汉语时间)、目的3(参加HSK的目的)、考试4(以前参加HSK的经历)、专业5、水平6(从听力、语法、阅读理解、综合填空、口语、写作等方面进行自我评价)、评价7(从录影效果、说话语速、背景知识、内容或主题的熟悉度、问题难易度、答案难易度等影响因素进行评价)。
图1:报名表与数据库的关系图
(二)各项统计结果
为了使考生特征更加清晰,从而更有利于分析和利用,我们将09年报名参加HSK的全部考生按考试类别分别建立了“初中等考生数据库”和“高等考生数据库”。由于存在缺考和网报的情况,所以我们所统计的现场报名人数与以上所统计的实考人数不是完全吻合的。09年共举行了4次初中等考试和2次高等考试,分别共有46067名和6268名考生参加了现场报名(见表1)。而出于自愿的原则,有些考生也并没有参与所有的调查项目。但是面对如此庞大的考试群体,我们仍有必要对其进行系统而全面的观察和分析。
1.母语分布
HSK考生来自欧亚美洲等各国,分布十分广泛。参与此项调查的考生初中等共有43301名、高等6022名,其中有少数华裔(即母语为汉语)和少数民族考生,由于前者人数较少(如初中等只有110名),而后者的语系大多与欧美语系相近,在此我们就不做详细分解,而是统统归于欧美考生。通过对“库1”和“库2”的统计,我们发现:初中等和高等考试中分别有59.36 %和70.46 %的考生来自日韩;剩下的40.64 %和29.54 %来自欧美等其他国家,各部分比例较少,详见表2。
表2:HSK考生母语分布比例(单位:%)
2.职业状况
两种等级的考试中几乎90%多的考生都是学生(详见表3),只有少数的为公司职员、家庭妇女、教师、医生、公务员、工程师或外交官等。其中学生又包括:小学生、中学生、大学生、研究生和博士生等。
表3:HSK考生中学生所占的人数(单位:个)和比例(单位:%)
3.参加HSK的目的
根据以往的经验,我们大致罗列了9项可能参加HSK的目的供考生选择,参与选择的初中等考生有37510名、高等考生有5117名。由于某些考生的目的并不是唯一的,因此存在多选的现象,在此我们仅仅呈现的是各项目被选择的次数,从而做一个简单的梳理,详见表4。
表4:HSK考生考试目的被选次数统计(单位:次)
很显然,无论是哪个等级的考生参加HSK的目的主要是出于了解自己的汉语水平,这也从另一个侧面反映了汉语的国际地位正在日益壮大,汉语的重要性正在日益突出。对于初中等考生而言,出于自身能力考虑和学业的需要,申请中国大学或大学学分和毕业资格使得他们务必取得相应的HSK成绩;而对于高等考生来说,由于较好的汉语能力,参加HSK的目的就成为他们获取工作的凭证之一。在申请大学和找工作等方面,除了考虑中国和自己国家以外,在其他国家寻求的考生似乎并不多。
4.专业情况
大体观察发现:考生的专业分布十分广泛,涉及文科类(包括语言、文学、经济、政治、地理、历史、法学、广电传媒、社会学等)、理工科类(包括医学、工商管理、各种工程学、环境科学、电子信息、生物学等)和艺术类(包括音乐、绘画、书法等)三大范畴。其中语言类的占到将近一半的水平(初中等48.80%、高等43.29%),尤其以汉语专业为重,详见表5。
表5:HSK考生专业分布比例(单位:%)
为了研究所需,我们只将语言文学集中统计,而将文科中其他专业与理工科类放在一起统称为“其他类”。从上表中可以看出:将近一半的考生专业是语言文学类,那么参加HSK这样的专业性考试来检验自身的汉语水平就毋庸置疑了。为了更有说服力,我们统计了这部分考生中有五分之一多的人(初中等22.61%、高等23.92%)是出于了解自己的汉语水平而参加的HSK。
5.影响听力理解的因素评价
任何语言的习得都必须强调“听说读写”四项技能的全面发展,由此不难看出听的重要性,因此作为语言测试的首要目标也就显得尤为重要。然而在真实的考试过程中,除了语言本身的因素影响以外,似乎还有其他因素有着或轻或重的制约力。我们根据以往的调查经验,将可能影响考生听力成绩的因素作一罗列,希望考生做出真实评价,据此我们统计出哪些因素最具影响力。
表6:HSK听力理解考试中的各影响因素所占比例(单位:%)
我们用五度测量法的计算方式将这些数据进行了再次整理,以便更加清晰地看出初中等考生和高等考生在听力理解方面究竟存在着哪些差异。其中影响程度从左到右分别记为1-5分,在此我们仅将各部分考生所占比例视为实际人数,目的在于研究两个等级的考生对各影响因素的评价程度如何。详见表7:
表7:HSK听力理解考试中各影响因素的等级差异
从表7中可以看出:两个等级的考生在听力理解各因素的影响程度上差异不大,但相对就细微差异而言,多数因素对初中等考生的影响较大,例如:语速的快慢、生词短语句子的熟悉度、背景知识的了解以及问题和答案本身所存在的疑惑等等;而对高等考生来说,由于汉语水平的提高,对题目中的基础信息几乎不存在困难,原本有影响的因素就显得不那么突出了,转而对录音效果等外界因素似乎要求更高,这也成为制约听力理解的主要原因。
三、数据分析及讨论
通过以上对数据库信息的统计,我们发现了很多以往所不曾注意到的考生特征,作为HSK服务的对象,我们有必要对其进行合理的分析,从而得出一些结论用于指导今后的工作并作为研究的基石。
(一)重视日韩考生的同时不可忽略欧美考生
或许是出于地理原因,或许是由于经济发展的需求,越来越多的日韩考生希望通过HSK成绩来对他们的汉语水平做出一个正确的评价。但是由于相近的语言体系和原本的语言基础,阅读和汉字无疑是他们的优势。而对于欧美考生来说,这部分的考核就成为他们成绩提高的制约因素。因此,在考虑整个考试的信效度的同时,如何更加合理的安排考试内容和考查形式也是我们需要思考的一个问题。因为无论从研究的角度,还是从HSK长远发展的角度,欧美考生都是不容忽视的一个重要群体。同样的,面对如此庞大的日韩考生,如何才能更加公平、合理、有效地实施测试,也是我们亟待解决的关键问题。
(二)考生职业的分布状况是测试范围的依据之一
虽然HSK考生的多数身份是学生,其中不排除有暂停工作重新充电的人,但是他们或多或少都扮演着一定的社会角色。鉴于此,我们的测试范围就不能仅仅局限于某些方面,而是应该考虑到不同考生的多层次生活范围,比如说公司职员的商业知识、家庭妇女的家居知识、热门专业的相关知识等等,这样才能更好地体现出汉语的丰富性和社会性,从而保证HSK具有更高的信度和效度。
(三)了解考生的考试目的才能更好地指导HSK的发展方向
通过了解考生目的,我们发现考生参加HSK的目的具有明显的多元性。无论是主动地寻求(想了解自己的汉语水平),还是被动地被要求(申请学校、找工作),都可以看出HSK有着十分广泛的市场和较高的信任度。当然,出于学习和就业的目的占了主流,这正说明HSK的重要性毋庸置疑,而出于兴趣的目的却相对较少,这也是我们值得反思的地方:如何能够吸引更多的外国人将考察自己汉语水平的要求寄予HSK。当然,推陈出新是出路之一,目前,针对考生和市场的变化,我们研发了很多考试类型,如C-TEST、HSK改进版、入门级等;但是这些改变还远远不够,为了使汉语水平考试更有生命力,我们需要从各个方面改善测试环节、测试内容和测试方法等等,更优化、更合理地为考生服务,真正做到“服务第一”的宗旨。
(四)考生专业的分布是掌握测试内容和难易度的参考因素
HSK是面向母语非汉语者的一般水平考试,不同年龄段、不同专业背景以及不同国籍的人都可以成为测试的对象,那么这样的语言类测试就要求做到统筹兼顾,以语言为主而又不能仅仅局限于语言。通过目前的统计发现,将近一半应试者的专业是语言类,对这部分考生而言,似乎比其他专业的考生占有一定的优势,但是我们同样不能忽视另一半的考生,虽然这一半考生的专业分布比较广泛,但是数量不容小觑。因此,如何做到真正的公平公正,使测试的难易度得到很好地体现,就需要我们更加关注测试内容的选择和测试方法的调整,使不同专业的应试者都能最大限度的从汉语水平考试中检验自己的学习效果、找到自己的欠缺之处和改进之点。
(五)分析不同级别考生对影响听力理解的原因评价有助于更好地指导命题环节
尽管听力理解在整个HSK中所占比例不大,但却一直是多数考生“比较头疼”的问题之一。究其原因,除了一半以上的日韩考生所特有的习得特征和心理因素所导致的问题以外,我们不排除制作测试题目或是测试题目本身所带来的一系列问题。这其中涉及到题目本身的问题,还关乎到整个卷面的难易度和信效度等等,不是可以整齐划一就可以解决的事情;而对制作过程的细节要求却是可以根据技术的提高做出相应地改善。当然,作为权威性的国家级考试,HSK的全部命题都是精益求精的,每一个环节都是力图全面而真实地反映出考生的真正语言能力。随着汉语在国际上的普及和推广,对HSK的命题也会提出更高的要求,命题人员将会面临新的挑战。
四、基于数据库的启示和建议
众所周知,HSK作为我国权威的汉语水平考试,既为我国招收留学生、选拔人才提供了标准,同时也是汉语国际推广的重要组成部分。在这过去的二十年中,她经历了起步、发展、 成熟和不断壮大的过程。时至今日,本研究仅仅是以其中的一个侧面来试图窥探HSK所服务的对象究竟有哪些特征,从而更好地完善今后的考务和研发工作,为HSK未来的市场定位和用户服务提供可靠的参考依据,同时基于数据库的建设,也为汉语教学和研究提供了一个可资借鉴的数据平台。本研究正是在数据库统计和分析的基础上,提出了一些拙见。
(1)作为一种国内外颇具影响的语言测试,考察习得者的语言能力是最终目的,因而分析考生的整体状况和综合特征就成为命题所不可或缺的前期准备。无论是从考生的母语、职业、专业,还是从考生的考试目的以及对听力理解的主观评价,都可以成为HSK命题的分析之源。唯有如此,才能更好地有的放矢、更加有效地实施测试。
(2)数据库中的其他信息,诸如:考点、考生序号、出生日期、时间1(代表在己国学习汉语时间)、时间2(代表在中国学习汉语时间)、考试4(以前参加HSK的状况)、水平6(从听力、语法、阅读理解、综合填空、口语、写作等方面进行自我评价)等,同样是分析考生特征的有力依据。例如:根据考点,可以看出考生选择考试地点与哪些因素因素有关;根据出生日期,可以分析考生的年龄差异;将学习汉语时间、以前的HSK成绩以及自我评价等因素与此次HSK成绩结合,分析考生汉语习得的趋势及成绩变化。
由于时间和精力有限,本文并未将数据库的信息加以全面分析,为以后的研究留下很多空间。当然,我们的数据库也有尚待完善和深入研究的必要,初步构想如下:
(1)将考生的统计特征数据库与他们的有效成绩库进行整合,生成一个新的更加全面的数据库,在此基础上的分析就会更加广泛。这不仅满足于HSK本身各项研究所需的数据,更对汉语习得领域提供了更为宝贵的数据来源。
(2)报名表中设立了中英文姓名,但由于种种原因数据库中并未设立这一字段,在以后的数据库完善过程中加入这两项,将大大有利于研究面的拓宽。这无疑开启了基于HSK的追踪研究的源头,以某些或某个考生为研究目标,观察其习得、成绩等的种种变化,得出更有价值的结论。
本研究课题为北京语言大学校级科研项目《HSK考试状况历时性研究》,项目编号为:08YB01。
[参考文献]
[1] 柴省三. 关于HSK(初中等)平行信度的实证研究[J]. 汉语学习, 2002,(2):65-69.
[2] 李慧. 汉语水平考试(初中级)阅读理解命题中的效度考虑[J]. 汉语学习, 2000,(5):55-59.
[3] 刘英林、郭树军、王志芳. 汉语水平考试(HSK)的性质和特点[J].世界汉语教学,1988,(2):110-120.
[4] 张凯. 测量是理论的组成部分——再谈构想效度[J]. 云南师范大学学报(对外汉语教学与研究版),2004,(5):7-14.
(作者单位:北京语言大学汉语水平考试中心)
[关键词]HSK考生数据库统计特征初中等高等
一、引言
中国汉语水平考试(HSK)是为测试母语非汉语者的汉语水平而设立的国家级标准化考试。在过去成长的二十多年中,HSK业已成为国内外有着广泛影响的汉语水平测量工具,先后有不少的学者针对HSK考试的效度、信度等问题进行过若干理论或实证方面的研究(如柴省三,2002;李慧,2000;郭树军,1988;张凯,2004等)。作为一种汉语能力考试,HSK与国内外颇具影响的大规模标准化语言测试(如TOEFL、CET、IELTS等)相比具有不少的共性。一方面,要保证其测验分数的解释具有较高的效度,必须对目标考生团体的统计特征,比如应试目的、母语背景、年龄结构、学业修养以及语言习得时间等方面进行尽可能详细的刻画,否则测验内容的界定以及测验结果的解释或使用就失去了参照的基础;另一方面,为了保证测验设计期望测量的目标考生与实际考生的统计特征具有较高的吻合行,针对一个既有的考试,研发人员还有必要对考生团体的结构特征进行统计分析,以获取测验解释或分数使用的效度证据。然而,由于受种种条件的限制,迄今为止,专门针对HSK目标考生团体的统计特征的大规模问卷调查研究尚不多见。
鉴于此,本文将以2009年国内HSK考生为调查目标,将问卷调查内容嵌入HSK报名表中,要求考生在报考HSK时认真填写相应的调查信息,然后将所有考生的有效问卷信息按照统一的规范建立考生数据库。这种数据采集方式既可以保证考生问卷填写的真实性,又可以提高信息采集的效率,因而数据的真实性也得到相应的保障。最后通过对考生报名表及基于报名表建立的数据库的介绍,着重从考生的五个侧面(母语背景、职业状况、考试目的、专业分布、对影响听力理解因素的评价)入手进行统计和分析,从而得出一些较有价值的统计证据,以期为今后的HSK研发和实践提供一定的借鉴。
二、考生数据库介绍及统计结果
迄今为止,汉语水平考试中心已经为1632377名国内外考生提供了这样的规范性考试及成绩报告。但是面对如此庞大的考生群体,我们只能将有限的人力物力投入到2009年国内HSK考生(包括4次初中等和2次高等,详见表1)的数据库建设上。
表1:2009年国内HSK考生人数统计(单位:个)
为了方便此次数据的录入和统计,我们分别设计了初中等和高等两种报名表。在参考HSK有关研发专家建议的基础上,专门设计了一份调查问卷。问卷内容分为两个部分:第一部分主要包括考生的若干生理、自然及社会属性方面的信息,比如出生日期、母语背景、国籍、性别、职业以及大学所学专业等,这些信息相对稳定或具有一定的静态性;第二部分则主要包括考生汉语习得时间、应考目的、对汉语水平的自我评价以及对HSK听力理解考试若干影响因素的个人评价等,这些信息属于考生的主观性评价,具有一定的动态性。为了保证填写信息的准确性,我们把问卷调查内容嵌入到HSK报名表中。在考试结束后,按考试类别将上述信息分别录入“HSK初中等考生数据库”(以下简称“库1”)和“HSK高等考生数据库”(以下简称“库2”)。这样既可以只针对考生数据库进行若干统计分析,也可以通过考生序号与考试成绩库建立相应的链接,从而进行考试成绩方面的深度数据挖掘,亦或进一步进行考试效度方面的研究。
(一)报名表及数据库的介绍
初中等和高等报名表只有颜色之分,内容基本一致,都大体分为三大部分,即:报名信息、静态信息和动态信息。我们的数据库是根据后面两部分建立起来的,即:“库1”和“库2”。(详见图1)该数据库共列有12个字段,分别是:考点、考生序号、出生日期、职业、母语、时间1(代表在己国学习汉语时间)、时间2(代表在中国学习汉语时间)、目的3(参加HSK的目的)、考试4(以前参加HSK的经历)、专业5、水平6(从听力、语法、阅读理解、综合填空、口语、写作等方面进行自我评价)、评价7(从录影效果、说话语速、背景知识、内容或主题的熟悉度、问题难易度、答案难易度等影响因素进行评价)。
图1:报名表与数据库的关系图
(二)各项统计结果
为了使考生特征更加清晰,从而更有利于分析和利用,我们将09年报名参加HSK的全部考生按考试类别分别建立了“初中等考生数据库”和“高等考生数据库”。由于存在缺考和网报的情况,所以我们所统计的现场报名人数与以上所统计的实考人数不是完全吻合的。09年共举行了4次初中等考试和2次高等考试,分别共有46067名和6268名考生参加了现场报名(见表1)。而出于自愿的原则,有些考生也并没有参与所有的调查项目。但是面对如此庞大的考试群体,我们仍有必要对其进行系统而全面的观察和分析。
1.母语分布
HSK考生来自欧亚美洲等各国,分布十分广泛。参与此项调查的考生初中等共有43301名、高等6022名,其中有少数华裔(即母语为汉语)和少数民族考生,由于前者人数较少(如初中等只有110名),而后者的语系大多与欧美语系相近,在此我们就不做详细分解,而是统统归于欧美考生。通过对“库1”和“库2”的统计,我们发现:初中等和高等考试中分别有59.36 %和70.46 %的考生来自日韩;剩下的40.64 %和29.54 %来自欧美等其他国家,各部分比例较少,详见表2。
表2:HSK考生母语分布比例(单位:%)
2.职业状况
两种等级的考试中几乎90%多的考生都是学生(详见表3),只有少数的为公司职员、家庭妇女、教师、医生、公务员、工程师或外交官等。其中学生又包括:小学生、中学生、大学生、研究生和博士生等。
表3:HSK考生中学生所占的人数(单位:个)和比例(单位:%)
3.参加HSK的目的
根据以往的经验,我们大致罗列了9项可能参加HSK的目的供考生选择,参与选择的初中等考生有37510名、高等考生有5117名。由于某些考生的目的并不是唯一的,因此存在多选的现象,在此我们仅仅呈现的是各项目被选择的次数,从而做一个简单的梳理,详见表4。
表4:HSK考生考试目的被选次数统计(单位:次)
很显然,无论是哪个等级的考生参加HSK的目的主要是出于了解自己的汉语水平,这也从另一个侧面反映了汉语的国际地位正在日益壮大,汉语的重要性正在日益突出。对于初中等考生而言,出于自身能力考虑和学业的需要,申请中国大学或大学学分和毕业资格使得他们务必取得相应的HSK成绩;而对于高等考生来说,由于较好的汉语能力,参加HSK的目的就成为他们获取工作的凭证之一。在申请大学和找工作等方面,除了考虑中国和自己国家以外,在其他国家寻求的考生似乎并不多。
4.专业情况
大体观察发现:考生的专业分布十分广泛,涉及文科类(包括语言、文学、经济、政治、地理、历史、法学、广电传媒、社会学等)、理工科类(包括医学、工商管理、各种工程学、环境科学、电子信息、生物学等)和艺术类(包括音乐、绘画、书法等)三大范畴。其中语言类的占到将近一半的水平(初中等48.80%、高等43.29%),尤其以汉语专业为重,详见表5。
表5:HSK考生专业分布比例(单位:%)
为了研究所需,我们只将语言文学集中统计,而将文科中其他专业与理工科类放在一起统称为“其他类”。从上表中可以看出:将近一半的考生专业是语言文学类,那么参加HSK这样的专业性考试来检验自身的汉语水平就毋庸置疑了。为了更有说服力,我们统计了这部分考生中有五分之一多的人(初中等22.61%、高等23.92%)是出于了解自己的汉语水平而参加的HSK。
5.影响听力理解的因素评价
任何语言的习得都必须强调“听说读写”四项技能的全面发展,由此不难看出听的重要性,因此作为语言测试的首要目标也就显得尤为重要。然而在真实的考试过程中,除了语言本身的因素影响以外,似乎还有其他因素有着或轻或重的制约力。我们根据以往的调查经验,将可能影响考生听力成绩的因素作一罗列,希望考生做出真实评价,据此我们统计出哪些因素最具影响力。
表6:HSK听力理解考试中的各影响因素所占比例(单位:%)
我们用五度测量法的计算方式将这些数据进行了再次整理,以便更加清晰地看出初中等考生和高等考生在听力理解方面究竟存在着哪些差异。其中影响程度从左到右分别记为1-5分,在此我们仅将各部分考生所占比例视为实际人数,目的在于研究两个等级的考生对各影响因素的评价程度如何。详见表7:
表7:HSK听力理解考试中各影响因素的等级差异
从表7中可以看出:两个等级的考生在听力理解各因素的影响程度上差异不大,但相对就细微差异而言,多数因素对初中等考生的影响较大,例如:语速的快慢、生词短语句子的熟悉度、背景知识的了解以及问题和答案本身所存在的疑惑等等;而对高等考生来说,由于汉语水平的提高,对题目中的基础信息几乎不存在困难,原本有影响的因素就显得不那么突出了,转而对录音效果等外界因素似乎要求更高,这也成为制约听力理解的主要原因。
三、数据分析及讨论
通过以上对数据库信息的统计,我们发现了很多以往所不曾注意到的考生特征,作为HSK服务的对象,我们有必要对其进行合理的分析,从而得出一些结论用于指导今后的工作并作为研究的基石。
(一)重视日韩考生的同时不可忽略欧美考生
或许是出于地理原因,或许是由于经济发展的需求,越来越多的日韩考生希望通过HSK成绩来对他们的汉语水平做出一个正确的评价。但是由于相近的语言体系和原本的语言基础,阅读和汉字无疑是他们的优势。而对于欧美考生来说,这部分的考核就成为他们成绩提高的制约因素。因此,在考虑整个考试的信效度的同时,如何更加合理的安排考试内容和考查形式也是我们需要思考的一个问题。因为无论从研究的角度,还是从HSK长远发展的角度,欧美考生都是不容忽视的一个重要群体。同样的,面对如此庞大的日韩考生,如何才能更加公平、合理、有效地实施测试,也是我们亟待解决的关键问题。
(二)考生职业的分布状况是测试范围的依据之一
虽然HSK考生的多数身份是学生,其中不排除有暂停工作重新充电的人,但是他们或多或少都扮演着一定的社会角色。鉴于此,我们的测试范围就不能仅仅局限于某些方面,而是应该考虑到不同考生的多层次生活范围,比如说公司职员的商业知识、家庭妇女的家居知识、热门专业的相关知识等等,这样才能更好地体现出汉语的丰富性和社会性,从而保证HSK具有更高的信度和效度。
(三)了解考生的考试目的才能更好地指导HSK的发展方向
通过了解考生目的,我们发现考生参加HSK的目的具有明显的多元性。无论是主动地寻求(想了解自己的汉语水平),还是被动地被要求(申请学校、找工作),都可以看出HSK有着十分广泛的市场和较高的信任度。当然,出于学习和就业的目的占了主流,这正说明HSK的重要性毋庸置疑,而出于兴趣的目的却相对较少,这也是我们值得反思的地方:如何能够吸引更多的外国人将考察自己汉语水平的要求寄予HSK。当然,推陈出新是出路之一,目前,针对考生和市场的变化,我们研发了很多考试类型,如C-TEST、HSK改进版、入门级等;但是这些改变还远远不够,为了使汉语水平考试更有生命力,我们需要从各个方面改善测试环节、测试内容和测试方法等等,更优化、更合理地为考生服务,真正做到“服务第一”的宗旨。
(四)考生专业的分布是掌握测试内容和难易度的参考因素
HSK是面向母语非汉语者的一般水平考试,不同年龄段、不同专业背景以及不同国籍的人都可以成为测试的对象,那么这样的语言类测试就要求做到统筹兼顾,以语言为主而又不能仅仅局限于语言。通过目前的统计发现,将近一半应试者的专业是语言类,对这部分考生而言,似乎比其他专业的考生占有一定的优势,但是我们同样不能忽视另一半的考生,虽然这一半考生的专业分布比较广泛,但是数量不容小觑。因此,如何做到真正的公平公正,使测试的难易度得到很好地体现,就需要我们更加关注测试内容的选择和测试方法的调整,使不同专业的应试者都能最大限度的从汉语水平考试中检验自己的学习效果、找到自己的欠缺之处和改进之点。
(五)分析不同级别考生对影响听力理解的原因评价有助于更好地指导命题环节
尽管听力理解在整个HSK中所占比例不大,但却一直是多数考生“比较头疼”的问题之一。究其原因,除了一半以上的日韩考生所特有的习得特征和心理因素所导致的问题以外,我们不排除制作测试题目或是测试题目本身所带来的一系列问题。这其中涉及到题目本身的问题,还关乎到整个卷面的难易度和信效度等等,不是可以整齐划一就可以解决的事情;而对制作过程的细节要求却是可以根据技术的提高做出相应地改善。当然,作为权威性的国家级考试,HSK的全部命题都是精益求精的,每一个环节都是力图全面而真实地反映出考生的真正语言能力。随着汉语在国际上的普及和推广,对HSK的命题也会提出更高的要求,命题人员将会面临新的挑战。
四、基于数据库的启示和建议
众所周知,HSK作为我国权威的汉语水平考试,既为我国招收留学生、选拔人才提供了标准,同时也是汉语国际推广的重要组成部分。在这过去的二十年中,她经历了起步、发展、 成熟和不断壮大的过程。时至今日,本研究仅仅是以其中的一个侧面来试图窥探HSK所服务的对象究竟有哪些特征,从而更好地完善今后的考务和研发工作,为HSK未来的市场定位和用户服务提供可靠的参考依据,同时基于数据库的建设,也为汉语教学和研究提供了一个可资借鉴的数据平台。本研究正是在数据库统计和分析的基础上,提出了一些拙见。
(1)作为一种国内外颇具影响的语言测试,考察习得者的语言能力是最终目的,因而分析考生的整体状况和综合特征就成为命题所不可或缺的前期准备。无论是从考生的母语、职业、专业,还是从考生的考试目的以及对听力理解的主观评价,都可以成为HSK命题的分析之源。唯有如此,才能更好地有的放矢、更加有效地实施测试。
(2)数据库中的其他信息,诸如:考点、考生序号、出生日期、时间1(代表在己国学习汉语时间)、时间2(代表在中国学习汉语时间)、考试4(以前参加HSK的状况)、水平6(从听力、语法、阅读理解、综合填空、口语、写作等方面进行自我评价)等,同样是分析考生特征的有力依据。例如:根据考点,可以看出考生选择考试地点与哪些因素因素有关;根据出生日期,可以分析考生的年龄差异;将学习汉语时间、以前的HSK成绩以及自我评价等因素与此次HSK成绩结合,分析考生汉语习得的趋势及成绩变化。
由于时间和精力有限,本文并未将数据库的信息加以全面分析,为以后的研究留下很多空间。当然,我们的数据库也有尚待完善和深入研究的必要,初步构想如下:
(1)将考生的统计特征数据库与他们的有效成绩库进行整合,生成一个新的更加全面的数据库,在此基础上的分析就会更加广泛。这不仅满足于HSK本身各项研究所需的数据,更对汉语习得领域提供了更为宝贵的数据来源。
(2)报名表中设立了中英文姓名,但由于种种原因数据库中并未设立这一字段,在以后的数据库完善过程中加入这两项,将大大有利于研究面的拓宽。这无疑开启了基于HSK的追踪研究的源头,以某些或某个考生为研究目标,观察其习得、成绩等的种种变化,得出更有价值的结论。
本研究课题为北京语言大学校级科研项目《HSK考试状况历时性研究》,项目编号为:08YB01。
[参考文献]
[1] 柴省三. 关于HSK(初中等)平行信度的实证研究[J]. 汉语学习, 2002,(2):65-69.
[2] 李慧. 汉语水平考试(初中级)阅读理解命题中的效度考虑[J]. 汉语学习, 2000,(5):55-59.
[3] 刘英林、郭树军、王志芳. 汉语水平考试(HSK)的性质和特点[J].世界汉语教学,1988,(2):110-120.
[4] 张凯. 测量是理论的组成部分——再谈构想效度[J]. 云南师范大学学报(对外汉语教学与研究版),2004,(5):7-14.
(作者单位:北京语言大学汉语水平考试中心)