论文部分内容阅读
摘要辞书大国中国曾经走过辉煌、新兴阶段,正在向辞书强国迈进。差距表现在辞书人才、辞书文本,尤其是辞书理论方面。文章根据多个数据的综合,认为我们离辞书强国还有50年的距离。清醒才知不足,直追才能缩小差距。
关键词 辞书强国 辞书人才 辞书理论 辞书文本
辞书大业,惠及天下,功在当今,利在千秋。它是民族思想、科学、文化和语言的结晶,是国运兴盛的标志。我国的辞书事业伴随国运,走过了一条漫长而曲折的路。大致可以分为五个阶段:(一)辉煌阶段;(二)新兴阶段;(三)辞书小国阶段;(四)辞书大国阶段;(五)走向辞书强国阶段。最后一阶段,还有一段遥远的路要走。
(一)辉煌阶段,指先秦至清末。这是一段漫长的历史,那时候国学独秀,国学的广袤沃土培育了近千种辞书。除去专书辞书,普通辞书也有600多种,而且形成了六大族群:
1 词书,主要有《尔雅》、《广雅》及《尔雅义疏》等雅系词书20多种,《方言》及《方言类聚》等方言系列词书10多种,《释名》及《释名疏证》等释名系列词书多种。这些词书,不仅对释义、解经、读书有辅助作用,而且对全民族向共同语的核心意义靠拢有着恒久的维系作用。
2 字书,主要有《说文解字》及《康熙字典》等系列字书200多种。这些字书,对单字、单音词、语素的定形、定义、定音,对书面语的标准化,都有久远的规范作用。
3 韵书,主要有《广韵》及《中原音韵》等韵书系列40多种。它们既是韵文用韵的总结和指导,也是读书音和共同语标准音的规范。
4 目录,主要有《四库全书总目》及《增订四库简明目录标注》等目录系列书20多种。利用这些书,不仅能检索图书的名称和要点,而且能指导阅读。
5 类书,主要有《艺文类聚》和《永乐大典》等类书系列50多种。利用这些书,不仅能检索辞藻典故和诗词文句,而且能查考史实和事物掌故。
6 政书,主要有《册府元龟》、《文献通考》和《清会要》等政书50多种。利用这些书,不仅能检索古代政治经济等制度史,而且能查考文化、学术史料。
在漫长的世界辞书历程中,神州九域筑起了光辉夺目的里程碑。与英伦三岛相比,中华大地在早期辞书跑道上领先了1800年,汉语大型辞书《字汇》(明梅膺祚,十四卷)与几本英语小辞书几乎同时出现在17世纪初。
(二)新兴阶段,指1911年至1949年。这一阶段,平均每年出版38部辞书,掩映着国学余晖和西学晨曦。一方面,《说文解字诂林》(正续1530卷)、《词诠》、《辞通》、《诗词曲语辞汇释》等掩映着一缕缕国学的余晖;另一方面,《中华大字典》、《辞源》、《辞海》、《国语辞典》等折射出一条条西学的晨曦,这预示着中国辞书事业从古老的辉煌转向现代的新兴。只是这条道路上的障碍太多,在马拉松赛中,我们被远远地抛下了。
(三)辞书小国阶段,指1950年至1977年。这一阶段,平均每年出版辞书125部,是前一阶段的3倍。然而,其中缺乏耀眼的传世之作,只有《新华字典》作为新中国辞书的代表,在联合国辞书展览厅里摆放在西方多部巨型辞书的一侧。
(四)辞书大国阶段,指1978年至2000年。这一阶段,平均每年出版600多部辞书,差不多是前一阶段的5倍,且不乏传世之作,如《现代汉语词典》、《辞海》(1979)、《辞源》(1979)、《汉语大字典》、《汉语大词典》、《中国大百科全书》、《英汉大词典》、《俄汉详解词典》等。
(五)走向辞书强国阶段,指从2001年至21世纪50年代前后。这一阶段,前十年已经有了良好开端,后几十年需要做大量艰苦的工作赶超辞书强国,主要有以下三大方面:
一、要成为辞书强国,人才必先强
辞书强国,首先强在人才。各辞书强国都拥有一批世界一流的博学的编纂专家。近三百年以来,辞书界人才辈出,数不胜数。仅举其中的领军人物(以生年为序)为例:
S.约翰逊(Samuel Johnson,1709—1784),牛津大学肄业,英国文学家,词典之父,1755年出版《英语词典》(2300页,4万多条)。
N.韦伯斯特(Noah Webster,1758—1843),1778年毕业于耶鲁大学。他的《美国拼写课本》至今已销售1亿册以上,被誉为“美国文化独立宣言书”,他还写过多篇英语论文。1828年出版了《美国英语词典》上下卷,收词7万条,比当时约翰逊词典的最新增订版多收词目1.2万余条,释义也更准确、细致。
P.A.拉鲁斯(Pierre Athanase Larousse,1817—1875),法国语言学家,百科全书编纂家。他的著述比巴尔扎克、雨果还多,影响最大的是《19世纪万有大词典》(1866—1876,15卷,后有补编2卷)。
K.杜登(Konrad Duden,1829—1911),德国语言学家,辞书编纂家。1880年出版《德语正词法大全词典》(收词2.7万条,17版收词16万条,至今已出23版)。后来,出版了一系列杜登词典。
U.H.乌沙科夫,苏联语言学家,院士,莫斯科大学教授,主编《俄语详解词典》(4卷)等词典。
c,M,奥热果夫,苏联语言学家,词典编纂家,莫斯科等大学教授。谢尔巴、维诺格拉多夫的高足。《俄语详解词典》的主要编写者,《俄语词典》主编,《现代俄罗斯标准语词典》(17卷)编委,还与他人合编了其他一些词典。
P.C.J,罗贝尔(Paul Charles Jules Robert,1910—1980),法国文化学者,辞书编纂家。1945年以后,编纂了著名的《大罗贝尔词典》、《小罗贝尔词典》和《微型罗贝尔词典》。
中国只有吕叔湘等几位先生是现代语言学者兼词典编纂家。我们要培养出这样一流的人才,至少需要40年。为什么要40年?跟这些世界名家相比,中国学者的差距在哪里?下面从三个方面加以阐述:
(一)知识结构、数量和水平。上列编纂专家首先是学者,他们精通语言学、语文学、文学、文化学、历史学或科学技术。他们在辞书之外,大多数都有重要论著传世。我国的许多辞书编纂者,高水平的论著几乎没有。 (二)创造能力。个人的创造能力,一部分靠天赋,一部分靠社会。近几百年,中西个人的创造能力的差异,主要在于社会。《英语词典》产生(1755年)前后的时代,正是文艺复兴之后,启蒙思想兴起之时。当时的社会,给科学创造提供了六个社会性的基石:①民主自由的环境;②多派新兴哲学共存互补;③多元先进文化互惠互利;④多种新的自然科学和社会科学竞相发展;⑤科学的理论思维处于主导地位;⑥以创新性为本的教育普遍展开。因此,许多领域取得了重大成就,辞书界也不例外。在宏观上,辞书界出现了实用主义、规定主义和描写主义三种主要思潮,同时也创造了百科、语文和专科等不同类型的现代辞书。在微观上,他们把词义分解为基本义、附属义和语用义,韦伯斯特把约翰逊的贡献和牛顿在数学上的贡献相提并论。而韦伯斯特则被誉为“美国语言之父”。当时的中国,著名学者有戴震、钱大昕、桂馥、段玉裁、王念孙、王引之、朱骏声等,他们正处于国学的乾嘉初期,崇尚实学、朴学或考据,轻视义理、推理,无视新科学。因而当时他们那一代的成果只限于国学继承类的,如《康熙字典》、《十三经注疏》、《大清会典》、《说文解字义证》、《说文解字注》等。
(三)大业精神。约翰逊、韦伯斯特等学者不仅仅是将辞书研究和编纂作为一种谋生的职业,更将其视为一生的事业,甚至将其作为几代人的大业。职业精神,对大业稍有帮助;事业精神,对大业大有帮助;只有大业精神,才能确保完成经国济世的千秋大业。例如《牛津英语词典》,自1858年筹备,26年后即1884年出版第1卷,再过44年即1928年才出齐10卷,6年后即1934年出版1卷《补编》,四五十年后即1972年、1976年、1982年、1986年分别出了4卷《补编》,1989年出版《牛津英语词典》第2版,共20卷。最终编成2.1万页,60多万个词条,240万条书证的超大规模词典,历时131年,数易主编,五代接力,千余人参编。唯此,方铸就千秋伟业!
二、要成为辞书强国,理论必先强
在多种现代科学,特别是语言学的推动下,20世纪60年代前后,欧美词典学进入了现代科学行列。仅仅是《法语宝库》到1969年就用现代理念和手段搜集相关语言学资料5万多篇/部。现代辞书科学新理论的产生,主要通过五条途径:升华、继承、借鉴、移植、创造。
辞书强国的辞书编纂理论起码具有下列六个特性:①理性;②本质的整体性;③内在的逻辑性;④多维的系统性;⑤结构的和谐性(这是爱因斯坦强调的);⑥多元论(奥地利籍伯克利加利福尼亚大学教授P.K.Feyerabend的主张),而不是一元论(托马斯·库恩的观点)。从编纂实践上升为辞书学理论,必须经过范畴化(categorization)。Lakoff(1987:5)认为:“对我们的思维、感知、行动和言语来说,再没有什么东西比范畴划分更基本的了。”范畴是知网的网结,是认知的枢纽,是理论的支撑点阵。范畴体系,就是理论。如何范畴化?辞书强国主要通过六种程序:经典范畴化,原型范畴化,提取最主要的区别特征,用最简明的词语、公式或模型表达范畴特征或属性,借助多种思维方式,尽可能杜绝一切直觉、内省的简单枚举。
辞书理论研究的成果,可以概括为四类:①综述型。对前人(古今中外)理论予以介绍、归纳、概括、总结,并举例说明。②跟踪型。对前人(主要是外国的)某一理论予以阐释、分析、应用——描写、解释某些现象。③创新型。在前人基础上提出新观点(如理念演绎辞书、同场同模式等)、新原理、新规律或新法则等。④引领型。提出新理论,被国内外学者引用、赞同。相较而言,我国综述型、跟踪型研究成果较多,创新型很少,引领型尚未出现。
在这般情况下,必须极力倡导:理论先行。
辞书理论,是辞书科学动力的第一要素。只有不断创新的辞书理论,才能增加辞书科学的知识总量。正如一位哲人说过的:“科学从根本意义上说就是理论。”
要成为辞书强国,辞书原创理论必须先行,尤其是必须输出领先的辞书理论。
必须树立新观念:理念演绎辞书,理念领跑辞书,理念提升辞书。否则,辞书只能在低层次上循环。现代辞书编纂,首先不属于经验范围,而属于理性范围。《法语宝库》主编伊姆勃斯认为,“搞不好词汇学也不能搞好词典学”。当前辞书强国研究的热点理论有12个:①实用主义、规范主义、描写主义三种主导思想及其有机结合问题;②解码词典和编码词典的对比和融合问题;③传统释义方法、新兴释义方法及其综合问题;④辞书元语言研究及其应用;⑤语料库研究及其应用;⑥辞书的信息处理与计算词典研究;⑦辞书编纂现代化和辞书的电子化研究;⑧辞书网络化研究;⑨语言和各种知识词典化研究;⑩国际辞书比较研究;(11)读者需求研究;(12)各国辞书史研究,先进经验吸收和借鉴研究。限于篇幅,这里简单谈谈前五个问题。
(一)实用主义、规范主义、描写主义三种主导思想及其有机结合问题
辞书强国研究和词典编纂者,对这三种思想,都应有清醒的认识。
先说实用主义。世界各国最早的辞书“难词词典”、“双语词典”都凸显了实用主义,后来的以“学习词典”为代表的一些辞书也在不同方面和程度上体现了实用主义。辞书的“实用”有多种:读经、释难、翻译、正音、正形、辨义、识字、用词、选词、查考、推广标准语……一本辞书最好突出一两个“实用”目的,适当兼顾其他。
次说规范主义(或规定主义)。规范,就是标准化,是对实用、描写的积极规约,是各国古今共同语的社会性需要。《英语词典》(约翰逊)、《法兰西学院词典》、《俄语详解词典》、《俄语词典》(奥热果夫)、《俄语词典》(科学院)等等辞书都贯彻了规范主义的思想。它们显示了多种规范原则:非逻辑原则(不能用狭义的逻辑苛求活生生的语言),历史原则(承认语言的历时演变),习惯原则(从俗从众),系统原则(兼顾个体及相关系统),科学原则(合于历时和共时学理或规律),功能原则(最能体现语言的功能的单位是首选),权威原则(权威的文本、用法常被公认),刚柔原则(语言要素的取舍、推广范围等都要注意刚柔),民族原则(外来词多民族化),国际原则(术语宜国际化),准确原则(能指应无偏差),经济原则(用较短的形式反映较多的内容)。历史告诉我们,上述这些原则,都是互相关联的。少数是双向关联,多数是多向关联。一本辞书应兼顾几个原则,适当照顾其余。 再说描写主义。韦伯斯特《美国英语词典》和《韦氏第三版新国际英语词典》等词典以描写为主,兼顾实用和规范,描写给实用提供了多种可能性,给规范提供了标准化的广泛基础。强国辞书中的描写,都尽可能地反映语言单位的五方面情况:①词音——语音常体及变体、现代标准音、古旧音、方俗音、书面音、口语音、重音、轻音、变音;②词形——词形常体及变体、古旧形、方俗形、常用形、罕用形、讹误形;③词义——词义常体及变体,现代语言义、古旧义、方俗义、常用义、罕用义、言语义;④语法——词的语法常体及变体、词性及其活用、常规及变异形态、句法标准功能及变异;⑤语用——词的语用常体及变体、音形义的修辞用法、从言语向语言的过渡用法。
一本好的辞书,不可能同时贯彻三个主义,而是以一个为主,兼顾其他。
(二)解码词典和编码词典的对比和融合问题
比起解码词典,编码词典至少有九个要素:①二语习得的新理念;②词目、义项的常用性;③义项划分的精细性;④释义中心的凸显性——词的用法;⑤元语言的可控性;⑥释义的综合性;⑦例证的语用性;⑧语料库的本源性;⑨读者本位性。本节只简要论述①、②、③、④、⑥、⑨各点(余者容后文论及)。
1 吸收了二语习得新理念
双语词典是学习词典的前奏。促使学习词典产生的第一个理念,就是二语习得的新理念。二战以后,学习英语成了当务之急,因而产生了学习英语的新理念——把词作为语义、语法、语用统一体,突出语用,提示惯用法。二语习得的转向,强调在正确性(correctness)基础上更突出得体性(appropriateness),于是1948年演绎出世界上第一部外向型、学习型词典——The Advanced Learner’s Dictionary of Current English(《高阶当代英语学习词典》,Horn-by主编)。20世纪70年代进入信息时代,英法美德俄等国涌现出了十多套编码词典。中国至今仍没有一部理想的编码词典。
2 词目、义项的常用性,编码词典中的常量、变量和足量
词汇是变量,词汇核心是常量。各类、各层次的语言交际,都共有一个基础词汇常量——约三五千个词。这个量,基本可以读懂、听懂书面语和口语。例如,根据Fries统计,英语常用词4000~5000个占书面语用词的95%,最常用词1000个占书面语用词的85%(兰多2005:301)。掌握汉语3000常用词,就能懂得一般语言材料的86.7%(北京语言学院语言研究所1986:1490)。由此演绎出《基础法语词典》、《基础英语词典》、《教学词典》等。这些常量,是学习词典的主体或核心。
词的基本语言意义是词义的常量,词的言语意义即语境意义是词义的变量。学习词典以描写词义的常量为主,也要照顾词义的变量。
义素也有常量和变量之分。义素常量指核心基本义素,义素变量指非核心、非基本义素,即次要并受语境制约的义素。对一个个词位及其义位来说,这个变量常因人、因时、因地、因事而变。就一个义位来说,义素少的有两个,多的有五六个,再多的有十来个。从变量义素中找出常量,这是学习词典编写者的责任。义素在学习词典里有三个量:超量,足量,非足量。超量,就是给出的义素过多;只有释文中提供必要的语义特征,那才是足量;没有满足释义必要的语义特征,那就是非足量;义素变量中的常量,多数情况下只有三个左右语义特征。
足量,就是最显著的、最具有区别性的、最容易感知的语义特征。其中既有事物本身特征的显著性因素,也有人们认知时注意点的因素,更有义位自身的义素特征。学习词典编写者应注意同时提取这三个因素,并同时赋予最佳的表述。
3 义项划分的精细性——吸收现代语义学成果
从19世纪20年代以来,洪堡特、密尔、索绪尔、萨丕尔、奥格登/理查兹、布龙菲尔德、吕叔湘、兹古斯塔、利奇、诺维科夫、莱昂斯等,对词义渐渐产生了二分观、三分观、四分观、七分观等。义位主要包含五个要素:第一是所指或外指意义(指物、指概念/观念等),第二是系统价值或内指意义(跟相关词的义差、用差等相区别),第三是各种附属意义(理性、感情、语体、语域、时空等),第四是语法意义(词性、结构、变化、功用等),第五是语用意义。这些现代语义理念,不仅先后演绎出《简明牛津英语词典》(1911)、《小拉鲁斯词典》(1906)、《俄语词典》(1949)、《现代汉语词典》(1960)、《小罗贝尔词典》(1972)等,而且被编码词典充分吸收并全面推进。
4 释义凸显词的用法——吸收语用学成果
20世纪,从房德里耶斯到克鲁斯,有些人主张词义就是用法。乌尔曼仅仅称其为“操作定义”(operational definitions)。大哲学家维特根斯坦到后期对自己主张的“用法说”也产生了怀疑。现代语用学主流学者认为,用法不等于词义,仅仅是词义多要素之一,有的是词的语言义,有的是词的言语义。以此为中心,编码词典吸收了语用学的许多成果。诸如:适当增加词、语、小句等内词条,必须交代词语的语境义及义位变体,凸显词语及其意义常用项(舍弃罕用项),提示话语结构、礼貌用法等。
5 例证的语用性,编码词典的新组合理念
组合所指的范围比搭配广,除了指词语搭配,还可以指语素之间、短语之间、句子之间及其内部语义的组合。解码词典给出的组合多是短语;已有的编码词典给出的组合多是句子。要强调的是,编码词典不仅必须配以例句,而且必须给出例语。而例语又必须给出两类:常见的组合、特殊(习惯、受限)的组合。
组合理念的中心,主要考虑非离散语法所谓的语句的合格度和可接受度,此外还有常用性和完整性。而语境理念主要考虑自然完整语句的语境,即语句的语言语境和非语言语境。最佳语境给被释词的“待填空白”,只能是一值(即被释词),不能是二值或多值(即被释词以外的词)。
6 编码词典的读者本位性
编码词典把读者对象置于前所未有的高度,置于前所未有的中心地位。例如,选词立目、释义配例,学习词典都是以读者的编码及解码需要为轴心,首先是频率原则,其次才是词汇、词义系统原则。 解码型、综合性词典向积极型、学习型词典靠拢,吸取其释义优点。《简明牛津英语词典》新版和《朗文当代英语大辞典》就是尽量吸收了学习词典的优点,因此获得了极大的成功。
(三)传统释义方法、新兴释义方法及其综合问题
一般说来,释义方法有下列七种:①同义对释;②反义对释;③素义对释;④短语对释;⑤个性义征+上义/类义义位;⑥叙述/描写物征、义征;⑦用自然语言完整句子表述义征。①②③④式注重的是被释词和解释词的共性,惯用于解码词典,如《钱伯斯20世纪词典》许多地方用同义对释。而在编码词典及类似的词典中很少用或完全不用同义对释,如旧版《小罗贝尔词典》中,同义对释只占15.02%,《现代法语词典》占3.7%,《柯林斯COBUILD英语词典》则全部采用完整句释义。⑤⑥式属于分解释义,注重的是被释词的个性,对于解码词典和编码词典都是适用的,但是使用的限度不同:一般用于解码词典的主条,广泛用于编码词典的主条和副条,但是在副条中还必须注明副条语义、语用个性。⑦式一般不用于解码词典,而用于编码词典,如《BBC英语词典》、《钱伯斯基础英语词典》、《朗文当代高级英语辞典》(第三版)、《柯林斯COBUILD英语词典》(占该词典释义总量的99%),但是不宜过多使用,因为用于自然语言完整句子中的词和被释词在许多情况下是不等值的,也就是语言系统的词位常常不等于“语段词”(言语语境中的词),个例遮蔽了类型,单一遮蔽了多样(多样信息、结构、搭配),基义遮蔽了陪义。总之,解码词典和编码词典的早中近期显示出的释义趋势是:从单一、分解、句子转至多式(①②③④⑤⑥⑦)综合。《麦克米伦英语学习词典》正向综合释义靠拢。
(四)辞书元语言研究及其应用
元语言,一是指用来释义的自然语言中的两三千个常用词,叫“释义元语言”或“义元”;二是指代表义素的人工设计的语言,叫“形式语言”、“符号语言”、“语义标示语”等。
前一理念即“释义元语言”的研究,主要有两个问题:一是定量研究,即选取多少个常用词释义较妥当,二是用少量的常用词如何表达复杂的释义内容,释文中的非常用词如何转化成常用词。辞书强国在解决这两个问题的基础上,演绎出了一系列词典,较早的有:1932年奥格登和理查兹《基础英语词典》(释义词850个),1935年威斯特《新方法英语词典》(释义词1779个,1961年版1490个),1971年《法语宝库》(有限度地使用了元语言,见其《导言·释文的语言》),1978年的《朗文当代高级英语辞典》(及以后各版释义词都是2000多个),1995年《柯林斯COBUILD英语词典》(释义词2000个),2000年《牛津高阶英语词典》(释义词3000以内),2002年《麦克米伦高阶英语词典》(释义词2500个)。总之,用少量元语言释义,已经成为以学习词典为代表的词典释义的主流趋势。未来理想的汉语学习词典,用4000个左右常用词释义较为合适。在这方面,我们落后了80年。
(五)语料库研究及其应用
语料库理念萌生于1959年伦敦大学语言学教授R.Quirk:几年间建起涵盖多种语体的上百万字的“英语用法语料库”。1961年美国布朗大学建起第一个机读的逾百万字的“布朗语料库”。从20世纪80年代起,柯林斯等出版社和伯明翰等大学合作,创建了“CO—BUILD语料库”,由此开发了《柯林斯COBUILD英语词典》。《牛津高阶英语学习词典》、《朗文当代高级英语辞典》、《钱伯斯基础英语词典》等的最新版本,也都是以语料库为依托编写而成。
语料库与人工卡片相比具有许多优越性:不仅省时、省力、省钱、省物、便捷,而且具有鲜活性和广阔性,它提供了广阔空间,使编者能够选择自然语言中完整、典型的例句。因此,编者不需要自造例句,必要时只需适当改动例句即可。
就规模而言,词典编纂用的理想语料库,其字节数量跟词典条目数之比,较合适的量应为10000:1。例如,4亿字的平衡语料库,对于编一部收词4万条的辞书较为适用。就内涵而言,语料库必须含书籍和报刊,而且是多地域、多语域、多语体(以上三项至少包括10多个子项)、多作者(至少1000多)、多学科(70左右)的,一个或各个断代的。它们代表活语言的真实文本,由此产生的词典才能是活语言的真实体现。可惜,到目前为止,中国既没有理想的语料库,也没有一部来自语料库的真实文本的词典。在这方面,我们比辞书强国晚了近40年。
以上述五个方面为代表的辞书热点理论的十二个方面的研究,不是孤立的,它们受制于现代哲学、文化学、语言学、数理逻辑学、数学、计算机科学以及其他科学技术。因此,在这些方面要想赶超辞书强国,至少需要二三十年。
三、要成为辞书强国,必须牢固地竖起主体标志——辞书文本
我国现在的辞书品种、系列、数量、规模等,较辞书强国还有很大的距离。
以古今兼收的大型语文辞书为例,我们的《汉语大词典》比《牛津英语词典》起步晚了120年,收词少了13万条,订补和检索方式也落后了。
大型现代语文辞书,我们至今还没有一部,而每个辞书强国都不止有一部这样的辞书。例如:法国早就有《法兰西学院词典》,20世纪50年代以后还有《大罗贝尔词典》、《大拉鲁斯法语词典》、《法语宝库》(1971年始出);德国有1915年始出的《杜登词典》;俄国有1950年始出的《现代俄罗斯标准语词典》;美国有1961年出版的《韦氏第三版新国际英语词典》;日本有1972年始出的《国语大词典》。平均比我们早50多年。
中型现代语文辞书,论数量,仅法国跟《现代汉语词典》规模相当的就有近10本。论时间,《法语通用词典》、《简明牛津英语词典》,比《现代汉语词典》分别早出版78年、67年。更令人瞩目的是,他们早已具有辞书品牌意识,牛津系列250多年,柯林斯系列190多年,韦伯斯特系列180多年,麦克米伦系列170多年,拉鲁斯系列150多年。如果我们的《新华字典》、《新华词典》等,算作“新华”系列,也只有几十年的历史。可见,国外的品牌意识,平均比我们早100多年。 现代英语语文辞书,在1940年前产生了一个全新的理念——以用词为主的学习词典,并于1942年出版了第一部学习词典——《英语习语及句法词典》(即《现代英语高级学生词典》前身)。近70年以来,学习词典经过了三代发展,至今在英国已经出现了五大学习词典家族分庭抗礼的兴盛局面:牛津、朗文、柯林斯、剑桥、麦克米伦。以其起步的年代而论,比我们接近合格的“学习词典”早了60多年。
我们虽然在1992年、1995年、2005年、2006年分别出版了几部“学习词典”,但是都不完全符合学习词典的要求,大多徒有虚名,跟《现代汉语词典》的相似率超过50%。
纸本辞书之外,辞书强国在电子辞书、网络辞书、现代编纂技术方面,也领先50年。强国的纸本和电子辞书等产业规模远远超过我们,英国一个名社甚至一部名典的销售额,真可谓“富敌一国”。这“富”跟高稿酬是互为良性循环的物质条件,他们的稿酬平均是我们的60倍。这样优越的物质条件塑造了一群群顶尖人才,催生并滋养着一个个新理论,雕刻出一套套杰出的辞书文本。
总之,从人才、理论、辞书文本以及产业规模四方面综合来看,我们离辞书强国还有50年左右的距离。
好在我们国运正隆,盛世鼎新。盛世修典史不绝,辞书强国梦定圆。只有强国梦圆,才能适应“应用力”居世界第二的汉语(联合国2005年“调查报告”)和持续升温的“汉语热”[近100个(2009年底为88个)国家的500多个孔子学院(含孔子课堂270多个)、4000多所大学以及1万多所华文学校共有6000多个班次、4000多万人(其中注册学员13万)在海外学汉语]。汉语的广泛传播,必定从多方面反哺中国的辞书事业。
参考文献
1 阿普列相著,语言整合性描写与体系性词典学,杜桂枝译,北京:北京大学出版社,2011.
2 北京语言学院语言教学研究所,现代汉语频率词典,北京:北京语言学院出版社,1986.
3 程依荣,法语词汇学概论,上海:上海外语教育出版社,2007.
4 黄建华,法国词典学一瞥,辞书研究,1980(2).
5 兰多,词典编纂的艺术与技巧(第二版),章宜华等译,北京:商务印书馆,2005.
6 罗贝尔,词典编纂问题,辞书研究,1980(2).
7 汪榕培等,英语词汇学教程,上海:上海外语教育出版社,1997.
8 徐祖友等,中国工具书大辞典,福州:福建人民出版社,1991,1996.
9 杨迈,现代俄语词汇学讲义,北京:北京师范大学出版社,1992.
10 章宜华等,当代词典学,北京:商务印书馆,2007.
11 郑述谱,词典·词汇·术语,哈尔滨:黑龙江人民出版社,2005.
(鲁东大学烟台264025)
(责任编辑 李潇潇)
关键词 辞书强国 辞书人才 辞书理论 辞书文本
辞书大业,惠及天下,功在当今,利在千秋。它是民族思想、科学、文化和语言的结晶,是国运兴盛的标志。我国的辞书事业伴随国运,走过了一条漫长而曲折的路。大致可以分为五个阶段:(一)辉煌阶段;(二)新兴阶段;(三)辞书小国阶段;(四)辞书大国阶段;(五)走向辞书强国阶段。最后一阶段,还有一段遥远的路要走。
(一)辉煌阶段,指先秦至清末。这是一段漫长的历史,那时候国学独秀,国学的广袤沃土培育了近千种辞书。除去专书辞书,普通辞书也有600多种,而且形成了六大族群:
1 词书,主要有《尔雅》、《广雅》及《尔雅义疏》等雅系词书20多种,《方言》及《方言类聚》等方言系列词书10多种,《释名》及《释名疏证》等释名系列词书多种。这些词书,不仅对释义、解经、读书有辅助作用,而且对全民族向共同语的核心意义靠拢有着恒久的维系作用。
2 字书,主要有《说文解字》及《康熙字典》等系列字书200多种。这些字书,对单字、单音词、语素的定形、定义、定音,对书面语的标准化,都有久远的规范作用。
3 韵书,主要有《广韵》及《中原音韵》等韵书系列40多种。它们既是韵文用韵的总结和指导,也是读书音和共同语标准音的规范。
4 目录,主要有《四库全书总目》及《增订四库简明目录标注》等目录系列书20多种。利用这些书,不仅能检索图书的名称和要点,而且能指导阅读。
5 类书,主要有《艺文类聚》和《永乐大典》等类书系列50多种。利用这些书,不仅能检索辞藻典故和诗词文句,而且能查考史实和事物掌故。
6 政书,主要有《册府元龟》、《文献通考》和《清会要》等政书50多种。利用这些书,不仅能检索古代政治经济等制度史,而且能查考文化、学术史料。
在漫长的世界辞书历程中,神州九域筑起了光辉夺目的里程碑。与英伦三岛相比,中华大地在早期辞书跑道上领先了1800年,汉语大型辞书《字汇》(明梅膺祚,十四卷)与几本英语小辞书几乎同时出现在17世纪初。
(二)新兴阶段,指1911年至1949年。这一阶段,平均每年出版38部辞书,掩映着国学余晖和西学晨曦。一方面,《说文解字诂林》(正续1530卷)、《词诠》、《辞通》、《诗词曲语辞汇释》等掩映着一缕缕国学的余晖;另一方面,《中华大字典》、《辞源》、《辞海》、《国语辞典》等折射出一条条西学的晨曦,这预示着中国辞书事业从古老的辉煌转向现代的新兴。只是这条道路上的障碍太多,在马拉松赛中,我们被远远地抛下了。
(三)辞书小国阶段,指1950年至1977年。这一阶段,平均每年出版辞书125部,是前一阶段的3倍。然而,其中缺乏耀眼的传世之作,只有《新华字典》作为新中国辞书的代表,在联合国辞书展览厅里摆放在西方多部巨型辞书的一侧。
(四)辞书大国阶段,指1978年至2000年。这一阶段,平均每年出版600多部辞书,差不多是前一阶段的5倍,且不乏传世之作,如《现代汉语词典》、《辞海》(1979)、《辞源》(1979)、《汉语大字典》、《汉语大词典》、《中国大百科全书》、《英汉大词典》、《俄汉详解词典》等。
(五)走向辞书强国阶段,指从2001年至21世纪50年代前后。这一阶段,前十年已经有了良好开端,后几十年需要做大量艰苦的工作赶超辞书强国,主要有以下三大方面:
一、要成为辞书强国,人才必先强
辞书强国,首先强在人才。各辞书强国都拥有一批世界一流的博学的编纂专家。近三百年以来,辞书界人才辈出,数不胜数。仅举其中的领军人物(以生年为序)为例:
S.约翰逊(Samuel Johnson,1709—1784),牛津大学肄业,英国文学家,词典之父,1755年出版《英语词典》(2300页,4万多条)。
N.韦伯斯特(Noah Webster,1758—1843),1778年毕业于耶鲁大学。他的《美国拼写课本》至今已销售1亿册以上,被誉为“美国文化独立宣言书”,他还写过多篇英语论文。1828年出版了《美国英语词典》上下卷,收词7万条,比当时约翰逊词典的最新增订版多收词目1.2万余条,释义也更准确、细致。
P.A.拉鲁斯(Pierre Athanase Larousse,1817—1875),法国语言学家,百科全书编纂家。他的著述比巴尔扎克、雨果还多,影响最大的是《19世纪万有大词典》(1866—1876,15卷,后有补编2卷)。
K.杜登(Konrad Duden,1829—1911),德国语言学家,辞书编纂家。1880年出版《德语正词法大全词典》(收词2.7万条,17版收词16万条,至今已出23版)。后来,出版了一系列杜登词典。
U.H.乌沙科夫,苏联语言学家,院士,莫斯科大学教授,主编《俄语详解词典》(4卷)等词典。
c,M,奥热果夫,苏联语言学家,词典编纂家,莫斯科等大学教授。谢尔巴、维诺格拉多夫的高足。《俄语详解词典》的主要编写者,《俄语词典》主编,《现代俄罗斯标准语词典》(17卷)编委,还与他人合编了其他一些词典。
P.C.J,罗贝尔(Paul Charles Jules Robert,1910—1980),法国文化学者,辞书编纂家。1945年以后,编纂了著名的《大罗贝尔词典》、《小罗贝尔词典》和《微型罗贝尔词典》。
中国只有吕叔湘等几位先生是现代语言学者兼词典编纂家。我们要培养出这样一流的人才,至少需要40年。为什么要40年?跟这些世界名家相比,中国学者的差距在哪里?下面从三个方面加以阐述:
(一)知识结构、数量和水平。上列编纂专家首先是学者,他们精通语言学、语文学、文学、文化学、历史学或科学技术。他们在辞书之外,大多数都有重要论著传世。我国的许多辞书编纂者,高水平的论著几乎没有。 (二)创造能力。个人的创造能力,一部分靠天赋,一部分靠社会。近几百年,中西个人的创造能力的差异,主要在于社会。《英语词典》产生(1755年)前后的时代,正是文艺复兴之后,启蒙思想兴起之时。当时的社会,给科学创造提供了六个社会性的基石:①民主自由的环境;②多派新兴哲学共存互补;③多元先进文化互惠互利;④多种新的自然科学和社会科学竞相发展;⑤科学的理论思维处于主导地位;⑥以创新性为本的教育普遍展开。因此,许多领域取得了重大成就,辞书界也不例外。在宏观上,辞书界出现了实用主义、规定主义和描写主义三种主要思潮,同时也创造了百科、语文和专科等不同类型的现代辞书。在微观上,他们把词义分解为基本义、附属义和语用义,韦伯斯特把约翰逊的贡献和牛顿在数学上的贡献相提并论。而韦伯斯特则被誉为“美国语言之父”。当时的中国,著名学者有戴震、钱大昕、桂馥、段玉裁、王念孙、王引之、朱骏声等,他们正处于国学的乾嘉初期,崇尚实学、朴学或考据,轻视义理、推理,无视新科学。因而当时他们那一代的成果只限于国学继承类的,如《康熙字典》、《十三经注疏》、《大清会典》、《说文解字义证》、《说文解字注》等。
(三)大业精神。约翰逊、韦伯斯特等学者不仅仅是将辞书研究和编纂作为一种谋生的职业,更将其视为一生的事业,甚至将其作为几代人的大业。职业精神,对大业稍有帮助;事业精神,对大业大有帮助;只有大业精神,才能确保完成经国济世的千秋大业。例如《牛津英语词典》,自1858年筹备,26年后即1884年出版第1卷,再过44年即1928年才出齐10卷,6年后即1934年出版1卷《补编》,四五十年后即1972年、1976年、1982年、1986年分别出了4卷《补编》,1989年出版《牛津英语词典》第2版,共20卷。最终编成2.1万页,60多万个词条,240万条书证的超大规模词典,历时131年,数易主编,五代接力,千余人参编。唯此,方铸就千秋伟业!
二、要成为辞书强国,理论必先强
在多种现代科学,特别是语言学的推动下,20世纪60年代前后,欧美词典学进入了现代科学行列。仅仅是《法语宝库》到1969年就用现代理念和手段搜集相关语言学资料5万多篇/部。现代辞书科学新理论的产生,主要通过五条途径:升华、继承、借鉴、移植、创造。
辞书强国的辞书编纂理论起码具有下列六个特性:①理性;②本质的整体性;③内在的逻辑性;④多维的系统性;⑤结构的和谐性(这是爱因斯坦强调的);⑥多元论(奥地利籍伯克利加利福尼亚大学教授P.K.Feyerabend的主张),而不是一元论(托马斯·库恩的观点)。从编纂实践上升为辞书学理论,必须经过范畴化(categorization)。Lakoff(1987:5)认为:“对我们的思维、感知、行动和言语来说,再没有什么东西比范畴划分更基本的了。”范畴是知网的网结,是认知的枢纽,是理论的支撑点阵。范畴体系,就是理论。如何范畴化?辞书强国主要通过六种程序:经典范畴化,原型范畴化,提取最主要的区别特征,用最简明的词语、公式或模型表达范畴特征或属性,借助多种思维方式,尽可能杜绝一切直觉、内省的简单枚举。
辞书理论研究的成果,可以概括为四类:①综述型。对前人(古今中外)理论予以介绍、归纳、概括、总结,并举例说明。②跟踪型。对前人(主要是外国的)某一理论予以阐释、分析、应用——描写、解释某些现象。③创新型。在前人基础上提出新观点(如理念演绎辞书、同场同模式等)、新原理、新规律或新法则等。④引领型。提出新理论,被国内外学者引用、赞同。相较而言,我国综述型、跟踪型研究成果较多,创新型很少,引领型尚未出现。
在这般情况下,必须极力倡导:理论先行。
辞书理论,是辞书科学动力的第一要素。只有不断创新的辞书理论,才能增加辞书科学的知识总量。正如一位哲人说过的:“科学从根本意义上说就是理论。”
要成为辞书强国,辞书原创理论必须先行,尤其是必须输出领先的辞书理论。
必须树立新观念:理念演绎辞书,理念领跑辞书,理念提升辞书。否则,辞书只能在低层次上循环。现代辞书编纂,首先不属于经验范围,而属于理性范围。《法语宝库》主编伊姆勃斯认为,“搞不好词汇学也不能搞好词典学”。当前辞书强国研究的热点理论有12个:①实用主义、规范主义、描写主义三种主导思想及其有机结合问题;②解码词典和编码词典的对比和融合问题;③传统释义方法、新兴释义方法及其综合问题;④辞书元语言研究及其应用;⑤语料库研究及其应用;⑥辞书的信息处理与计算词典研究;⑦辞书编纂现代化和辞书的电子化研究;⑧辞书网络化研究;⑨语言和各种知识词典化研究;⑩国际辞书比较研究;(11)读者需求研究;(12)各国辞书史研究,先进经验吸收和借鉴研究。限于篇幅,这里简单谈谈前五个问题。
(一)实用主义、规范主义、描写主义三种主导思想及其有机结合问题
辞书强国研究和词典编纂者,对这三种思想,都应有清醒的认识。
先说实用主义。世界各国最早的辞书“难词词典”、“双语词典”都凸显了实用主义,后来的以“学习词典”为代表的一些辞书也在不同方面和程度上体现了实用主义。辞书的“实用”有多种:读经、释难、翻译、正音、正形、辨义、识字、用词、选词、查考、推广标准语……一本辞书最好突出一两个“实用”目的,适当兼顾其他。
次说规范主义(或规定主义)。规范,就是标准化,是对实用、描写的积极规约,是各国古今共同语的社会性需要。《英语词典》(约翰逊)、《法兰西学院词典》、《俄语详解词典》、《俄语词典》(奥热果夫)、《俄语词典》(科学院)等等辞书都贯彻了规范主义的思想。它们显示了多种规范原则:非逻辑原则(不能用狭义的逻辑苛求活生生的语言),历史原则(承认语言的历时演变),习惯原则(从俗从众),系统原则(兼顾个体及相关系统),科学原则(合于历时和共时学理或规律),功能原则(最能体现语言的功能的单位是首选),权威原则(权威的文本、用法常被公认),刚柔原则(语言要素的取舍、推广范围等都要注意刚柔),民族原则(外来词多民族化),国际原则(术语宜国际化),准确原则(能指应无偏差),经济原则(用较短的形式反映较多的内容)。历史告诉我们,上述这些原则,都是互相关联的。少数是双向关联,多数是多向关联。一本辞书应兼顾几个原则,适当照顾其余。 再说描写主义。韦伯斯特《美国英语词典》和《韦氏第三版新国际英语词典》等词典以描写为主,兼顾实用和规范,描写给实用提供了多种可能性,给规范提供了标准化的广泛基础。强国辞书中的描写,都尽可能地反映语言单位的五方面情况:①词音——语音常体及变体、现代标准音、古旧音、方俗音、书面音、口语音、重音、轻音、变音;②词形——词形常体及变体、古旧形、方俗形、常用形、罕用形、讹误形;③词义——词义常体及变体,现代语言义、古旧义、方俗义、常用义、罕用义、言语义;④语法——词的语法常体及变体、词性及其活用、常规及变异形态、句法标准功能及变异;⑤语用——词的语用常体及变体、音形义的修辞用法、从言语向语言的过渡用法。
一本好的辞书,不可能同时贯彻三个主义,而是以一个为主,兼顾其他。
(二)解码词典和编码词典的对比和融合问题
比起解码词典,编码词典至少有九个要素:①二语习得的新理念;②词目、义项的常用性;③义项划分的精细性;④释义中心的凸显性——词的用法;⑤元语言的可控性;⑥释义的综合性;⑦例证的语用性;⑧语料库的本源性;⑨读者本位性。本节只简要论述①、②、③、④、⑥、⑨各点(余者容后文论及)。
1 吸收了二语习得新理念
双语词典是学习词典的前奏。促使学习词典产生的第一个理念,就是二语习得的新理念。二战以后,学习英语成了当务之急,因而产生了学习英语的新理念——把词作为语义、语法、语用统一体,突出语用,提示惯用法。二语习得的转向,强调在正确性(correctness)基础上更突出得体性(appropriateness),于是1948年演绎出世界上第一部外向型、学习型词典——The Advanced Learner’s Dictionary of Current English(《高阶当代英语学习词典》,Horn-by主编)。20世纪70年代进入信息时代,英法美德俄等国涌现出了十多套编码词典。中国至今仍没有一部理想的编码词典。
2 词目、义项的常用性,编码词典中的常量、变量和足量
词汇是变量,词汇核心是常量。各类、各层次的语言交际,都共有一个基础词汇常量——约三五千个词。这个量,基本可以读懂、听懂书面语和口语。例如,根据Fries统计,英语常用词4000~5000个占书面语用词的95%,最常用词1000个占书面语用词的85%(兰多2005:301)。掌握汉语3000常用词,就能懂得一般语言材料的86.7%(北京语言学院语言研究所1986:1490)。由此演绎出《基础法语词典》、《基础英语词典》、《教学词典》等。这些常量,是学习词典的主体或核心。
词的基本语言意义是词义的常量,词的言语意义即语境意义是词义的变量。学习词典以描写词义的常量为主,也要照顾词义的变量。
义素也有常量和变量之分。义素常量指核心基本义素,义素变量指非核心、非基本义素,即次要并受语境制约的义素。对一个个词位及其义位来说,这个变量常因人、因时、因地、因事而变。就一个义位来说,义素少的有两个,多的有五六个,再多的有十来个。从变量义素中找出常量,这是学习词典编写者的责任。义素在学习词典里有三个量:超量,足量,非足量。超量,就是给出的义素过多;只有释文中提供必要的语义特征,那才是足量;没有满足释义必要的语义特征,那就是非足量;义素变量中的常量,多数情况下只有三个左右语义特征。
足量,就是最显著的、最具有区别性的、最容易感知的语义特征。其中既有事物本身特征的显著性因素,也有人们认知时注意点的因素,更有义位自身的义素特征。学习词典编写者应注意同时提取这三个因素,并同时赋予最佳的表述。
3 义项划分的精细性——吸收现代语义学成果
从19世纪20年代以来,洪堡特、密尔、索绪尔、萨丕尔、奥格登/理查兹、布龙菲尔德、吕叔湘、兹古斯塔、利奇、诺维科夫、莱昂斯等,对词义渐渐产生了二分观、三分观、四分观、七分观等。义位主要包含五个要素:第一是所指或外指意义(指物、指概念/观念等),第二是系统价值或内指意义(跟相关词的义差、用差等相区别),第三是各种附属意义(理性、感情、语体、语域、时空等),第四是语法意义(词性、结构、变化、功用等),第五是语用意义。这些现代语义理念,不仅先后演绎出《简明牛津英语词典》(1911)、《小拉鲁斯词典》(1906)、《俄语词典》(1949)、《现代汉语词典》(1960)、《小罗贝尔词典》(1972)等,而且被编码词典充分吸收并全面推进。
4 释义凸显词的用法——吸收语用学成果
20世纪,从房德里耶斯到克鲁斯,有些人主张词义就是用法。乌尔曼仅仅称其为“操作定义”(operational definitions)。大哲学家维特根斯坦到后期对自己主张的“用法说”也产生了怀疑。现代语用学主流学者认为,用法不等于词义,仅仅是词义多要素之一,有的是词的语言义,有的是词的言语义。以此为中心,编码词典吸收了语用学的许多成果。诸如:适当增加词、语、小句等内词条,必须交代词语的语境义及义位变体,凸显词语及其意义常用项(舍弃罕用项),提示话语结构、礼貌用法等。
5 例证的语用性,编码词典的新组合理念
组合所指的范围比搭配广,除了指词语搭配,还可以指语素之间、短语之间、句子之间及其内部语义的组合。解码词典给出的组合多是短语;已有的编码词典给出的组合多是句子。要强调的是,编码词典不仅必须配以例句,而且必须给出例语。而例语又必须给出两类:常见的组合、特殊(习惯、受限)的组合。
组合理念的中心,主要考虑非离散语法所谓的语句的合格度和可接受度,此外还有常用性和完整性。而语境理念主要考虑自然完整语句的语境,即语句的语言语境和非语言语境。最佳语境给被释词的“待填空白”,只能是一值(即被释词),不能是二值或多值(即被释词以外的词)。
6 编码词典的读者本位性
编码词典把读者对象置于前所未有的高度,置于前所未有的中心地位。例如,选词立目、释义配例,学习词典都是以读者的编码及解码需要为轴心,首先是频率原则,其次才是词汇、词义系统原则。 解码型、综合性词典向积极型、学习型词典靠拢,吸取其释义优点。《简明牛津英语词典》新版和《朗文当代英语大辞典》就是尽量吸收了学习词典的优点,因此获得了极大的成功。
(三)传统释义方法、新兴释义方法及其综合问题
一般说来,释义方法有下列七种:①同义对释;②反义对释;③素义对释;④短语对释;⑤个性义征+上义/类义义位;⑥叙述/描写物征、义征;⑦用自然语言完整句子表述义征。①②③④式注重的是被释词和解释词的共性,惯用于解码词典,如《钱伯斯20世纪词典》许多地方用同义对释。而在编码词典及类似的词典中很少用或完全不用同义对释,如旧版《小罗贝尔词典》中,同义对释只占15.02%,《现代法语词典》占3.7%,《柯林斯COBUILD英语词典》则全部采用完整句释义。⑤⑥式属于分解释义,注重的是被释词的个性,对于解码词典和编码词典都是适用的,但是使用的限度不同:一般用于解码词典的主条,广泛用于编码词典的主条和副条,但是在副条中还必须注明副条语义、语用个性。⑦式一般不用于解码词典,而用于编码词典,如《BBC英语词典》、《钱伯斯基础英语词典》、《朗文当代高级英语辞典》(第三版)、《柯林斯COBUILD英语词典》(占该词典释义总量的99%),但是不宜过多使用,因为用于自然语言完整句子中的词和被释词在许多情况下是不等值的,也就是语言系统的词位常常不等于“语段词”(言语语境中的词),个例遮蔽了类型,单一遮蔽了多样(多样信息、结构、搭配),基义遮蔽了陪义。总之,解码词典和编码词典的早中近期显示出的释义趋势是:从单一、分解、句子转至多式(①②③④⑤⑥⑦)综合。《麦克米伦英语学习词典》正向综合释义靠拢。
(四)辞书元语言研究及其应用
元语言,一是指用来释义的自然语言中的两三千个常用词,叫“释义元语言”或“义元”;二是指代表义素的人工设计的语言,叫“形式语言”、“符号语言”、“语义标示语”等。
前一理念即“释义元语言”的研究,主要有两个问题:一是定量研究,即选取多少个常用词释义较妥当,二是用少量的常用词如何表达复杂的释义内容,释文中的非常用词如何转化成常用词。辞书强国在解决这两个问题的基础上,演绎出了一系列词典,较早的有:1932年奥格登和理查兹《基础英语词典》(释义词850个),1935年威斯特《新方法英语词典》(释义词1779个,1961年版1490个),1971年《法语宝库》(有限度地使用了元语言,见其《导言·释文的语言》),1978年的《朗文当代高级英语辞典》(及以后各版释义词都是2000多个),1995年《柯林斯COBUILD英语词典》(释义词2000个),2000年《牛津高阶英语词典》(释义词3000以内),2002年《麦克米伦高阶英语词典》(释义词2500个)。总之,用少量元语言释义,已经成为以学习词典为代表的词典释义的主流趋势。未来理想的汉语学习词典,用4000个左右常用词释义较为合适。在这方面,我们落后了80年。
(五)语料库研究及其应用
语料库理念萌生于1959年伦敦大学语言学教授R.Quirk:几年间建起涵盖多种语体的上百万字的“英语用法语料库”。1961年美国布朗大学建起第一个机读的逾百万字的“布朗语料库”。从20世纪80年代起,柯林斯等出版社和伯明翰等大学合作,创建了“CO—BUILD语料库”,由此开发了《柯林斯COBUILD英语词典》。《牛津高阶英语学习词典》、《朗文当代高级英语辞典》、《钱伯斯基础英语词典》等的最新版本,也都是以语料库为依托编写而成。
语料库与人工卡片相比具有许多优越性:不仅省时、省力、省钱、省物、便捷,而且具有鲜活性和广阔性,它提供了广阔空间,使编者能够选择自然语言中完整、典型的例句。因此,编者不需要自造例句,必要时只需适当改动例句即可。
就规模而言,词典编纂用的理想语料库,其字节数量跟词典条目数之比,较合适的量应为10000:1。例如,4亿字的平衡语料库,对于编一部收词4万条的辞书较为适用。就内涵而言,语料库必须含书籍和报刊,而且是多地域、多语域、多语体(以上三项至少包括10多个子项)、多作者(至少1000多)、多学科(70左右)的,一个或各个断代的。它们代表活语言的真实文本,由此产生的词典才能是活语言的真实体现。可惜,到目前为止,中国既没有理想的语料库,也没有一部来自语料库的真实文本的词典。在这方面,我们比辞书强国晚了近40年。
以上述五个方面为代表的辞书热点理论的十二个方面的研究,不是孤立的,它们受制于现代哲学、文化学、语言学、数理逻辑学、数学、计算机科学以及其他科学技术。因此,在这些方面要想赶超辞书强国,至少需要二三十年。
三、要成为辞书强国,必须牢固地竖起主体标志——辞书文本
我国现在的辞书品种、系列、数量、规模等,较辞书强国还有很大的距离。
以古今兼收的大型语文辞书为例,我们的《汉语大词典》比《牛津英语词典》起步晚了120年,收词少了13万条,订补和检索方式也落后了。
大型现代语文辞书,我们至今还没有一部,而每个辞书强国都不止有一部这样的辞书。例如:法国早就有《法兰西学院词典》,20世纪50年代以后还有《大罗贝尔词典》、《大拉鲁斯法语词典》、《法语宝库》(1971年始出);德国有1915年始出的《杜登词典》;俄国有1950年始出的《现代俄罗斯标准语词典》;美国有1961年出版的《韦氏第三版新国际英语词典》;日本有1972年始出的《国语大词典》。平均比我们早50多年。
中型现代语文辞书,论数量,仅法国跟《现代汉语词典》规模相当的就有近10本。论时间,《法语通用词典》、《简明牛津英语词典》,比《现代汉语词典》分别早出版78年、67年。更令人瞩目的是,他们早已具有辞书品牌意识,牛津系列250多年,柯林斯系列190多年,韦伯斯特系列180多年,麦克米伦系列170多年,拉鲁斯系列150多年。如果我们的《新华字典》、《新华词典》等,算作“新华”系列,也只有几十年的历史。可见,国外的品牌意识,平均比我们早100多年。 现代英语语文辞书,在1940年前产生了一个全新的理念——以用词为主的学习词典,并于1942年出版了第一部学习词典——《英语习语及句法词典》(即《现代英语高级学生词典》前身)。近70年以来,学习词典经过了三代发展,至今在英国已经出现了五大学习词典家族分庭抗礼的兴盛局面:牛津、朗文、柯林斯、剑桥、麦克米伦。以其起步的年代而论,比我们接近合格的“学习词典”早了60多年。
我们虽然在1992年、1995年、2005年、2006年分别出版了几部“学习词典”,但是都不完全符合学习词典的要求,大多徒有虚名,跟《现代汉语词典》的相似率超过50%。
纸本辞书之外,辞书强国在电子辞书、网络辞书、现代编纂技术方面,也领先50年。强国的纸本和电子辞书等产业规模远远超过我们,英国一个名社甚至一部名典的销售额,真可谓“富敌一国”。这“富”跟高稿酬是互为良性循环的物质条件,他们的稿酬平均是我们的60倍。这样优越的物质条件塑造了一群群顶尖人才,催生并滋养着一个个新理论,雕刻出一套套杰出的辞书文本。
总之,从人才、理论、辞书文本以及产业规模四方面综合来看,我们离辞书强国还有50年左右的距离。
好在我们国运正隆,盛世鼎新。盛世修典史不绝,辞书强国梦定圆。只有强国梦圆,才能适应“应用力”居世界第二的汉语(联合国2005年“调查报告”)和持续升温的“汉语热”[近100个(2009年底为88个)国家的500多个孔子学院(含孔子课堂270多个)、4000多所大学以及1万多所华文学校共有6000多个班次、4000多万人(其中注册学员13万)在海外学汉语]。汉语的广泛传播,必定从多方面反哺中国的辞书事业。
参考文献
1 阿普列相著,语言整合性描写与体系性词典学,杜桂枝译,北京:北京大学出版社,2011.
2 北京语言学院语言教学研究所,现代汉语频率词典,北京:北京语言学院出版社,1986.
3 程依荣,法语词汇学概论,上海:上海外语教育出版社,2007.
4 黄建华,法国词典学一瞥,辞书研究,1980(2).
5 兰多,词典编纂的艺术与技巧(第二版),章宜华等译,北京:商务印书馆,2005.
6 罗贝尔,词典编纂问题,辞书研究,1980(2).
7 汪榕培等,英语词汇学教程,上海:上海外语教育出版社,1997.
8 徐祖友等,中国工具书大辞典,福州:福建人民出版社,1991,1996.
9 杨迈,现代俄语词汇学讲义,北京:北京师范大学出版社,1992.
10 章宜华等,当代词典学,北京:商务印书馆,2007.
11 郑述谱,词典·词汇·术语,哈尔滨:黑龙江人民出版社,2005.
(鲁东大学烟台264025)
(责任编辑 李潇潇)