论文部分内容阅读
核心词是在运用某一语言的交际中,在传递信息过程中起重要作用的,最基本、最常用的一部分词。它们是不同语域、不同语体、不同风格的言语交际(包括口头和书面)中词汇的共核(common core)部分,在词汇语义系统处于核心位置。从语言使用者的角度来说,核心词对于任何说本族语言的成年人来说都能使用和理解。从跨文化交际的视角来看,核心词在一定程度上说可视为各种语言中“普遍词汇”。面向第二语言教学的核心词是在汉语学习的初级阶段必需掌握的词语。核心词和非核心词之间并没有明显的边界,两者之间存在中间状态,整个词汇系统是由核心词向非核心词的逐渐过渡。因此,核心词有典型范畴和边缘范畴之分,说一个词更接近词汇的核心层面,或用程度来描绘核心词更为准确。面向第二语言教学的核心词表是在现代汉语核心词表研制的基础上充分考虑第二语言教学的规律制定出来的,其服务对象是以汉语作为第二语言的任何初学者,除此之外,不考虑年龄、国别、社会地位、学习目的、学习环境(目的语国家或非目的语国家)和学习形式(学校正规训练或自学)等其他因素的影响,力图追求最广泛的通用性和适用性。根据齐普夫定律,任何语言中最常用词的出现频率是次常用词的两倍;是第三级常用词的三倍;第一百级常用词的一百倍;第一千级常用词的一千倍……这说明,只要掌握一种语言中比例不多的最常用词,就有可能理解该语言的相当一部分内容。现代汉语词汇的分布规律表明,3000词条是现代汉语核心词的重要量值,大致可以覆盖整个语料的75%左右。在此之后,整个语言覆盖率的增长则明显缓慢。初级阶段汉语教学的任务是规范的口语教学,与整个现代汉语词汇的分布规律相比,生活口语语料高频词的覆盖率更加集中。因此,面向第二语言教学的汉语核心词数量应该少于3000个,大约在2300到2800之间。核心词的判断标准围绕常用性、均衡性、稳定性、通用性以及组合能力强五个方面考察。面向第二语言教学的现代汉语核心词表的研制工作分三步逐层进行。首先采取对比提取法,从三个平衡语料库中提取现代汉语常用词;在此基础上根据核心词的通用性标准和规范性原则,筛选出符合要求的现代汉语核心词表;最后根据第二语言的习得规律,从微观层而进一步优化现代汉语核心词表的通用性,并适当考虑习得因素,得到面向第二语言教学的2397个现代汉语核心词。在词表的研制过程中,我们得出以下几点认识:1.词表研制的科学性总是相对而言的。一方面,语言符号的随机性特征决定了语料库的统计只能是一种“大致情况”。另一方面,语料库不可避免地受到社会文化因素的影响,因此提取自语料库的词表不可能做到绝对意义的“纯”。2.词表研制中出现的问题很多时候是源于语料库本身的科学性和适用程度。从总体上看,联想添加并不能很好地克服词频统计的局限,一方面,联想添加是基于词义距离,并不反映词的常用程度;另一方面,语言研究的大量事实早已证明,以意义为标准很多时候是不可靠的。基于语料库的词汇统计比联想更加符合语言的客观事实,词表研制的科学性还是应该绕回到语料库的建设和选取上下功夫。3.面向第二语言教学的核心词表有其自身的特点。初级阶段汉语教学的任务是规范口语,中高级阶段逐步向书面语倾斜。相应的,初级阶段和中高级阶段汉语教学词表研制所使用的语料库应该有所不同。初级阶段词表的提取应该选择题材平衡的规范口语语料库,而不是一般意义的平衡语料库。4.从语料库生成的词表反映的是以汉语为母语的成年人使用词语的常用情况,不涉及二语学习过程中的习得顺序因素。有些常用程度很高的词语从习得顺序的角度看并不适合在初级阶段学习。因此,初级阶段汉语词表的研制还要根据习得顺序因素排查若干较难掌握的词语。