论文部分内容阅读
引言
本文以历时中包含有共时,共时中包含有历时的相对时间观为哲学基础,利用动态流通语料库的理论和方法,探讨在共时状态的现代汉语中对新词语进行历时考察与监测的问题。
一般来说,实用意义(有别于词典学的意义)上的“新词”有两个含义:第一,从时间参照角度来说,新词可以是“出现在某一时间段内或自某一时间点以来所首次出现的词汇”。第二,从蓝本参照角度来说,新词指的是“某一词典、一些词典或所有现有词典未曾收录的词汇”。(高永伟1998)
本文针对新词语的历时考察,是指对已经收入新词语词典的新词语进行回溯性的调查和定量分析,追溯新词语的词源,通过新词语的历时流通度曲线的变化,分析总结新词语的使用情况和发展变化规律。新词语监测是指发现新词语并对其使用情况进行实时监测,也包括发现旧词语的新义和新用法,为研究语言的发展变化,也为语言规范化和辞典编纂,特别是新词语词典的收词标准提供量化的科学依据。为了行文方便,以下统称为新词语监测研究。
一、语言研究的相对时间观和新词语监测研究
时间观是语言研究方法论的一个重要基础(徐通锵,1997)。张普、石定果(2003)提出了语言研究中历时中包含有共时,共时中包含有历时的相对时间观,指出,共时状态是语言的空间态,历时状态是时间态,语言的时间状态和空间状态都是客观存在着的,从时间与空间的双重状态来观察分析,才是全方位的。历时状态最重要的特征包括:
1.活着的语言永远在变化,变化是绝对的,历时状态是语言的时间态,历时研究是对语言的时间态进行观察、分析、对比、评估等等。这种观察、分析、对比、评估,原则上可以是就整个语言系统进行的,也可以是就某些个别语言要素来进行的。
2.语言历时状态的演进是不平衡的,不同的要素发展变化速度并不相同,例如词汇、语义要素变化相对较快,语音、语法要素变化相对较慢。即使变化较快的词汇要素,内部也体现了差异性,基本词汇部分相对稳定,一般词汇则比较活跃,术语和某些新闻词语的更新尤其迅速。
3.语言是社会交际的工具,语言的发展变化基本上与社会的发展变化同步,社会政治、经济、文化、科学技术等各个领域的任何急剧变革都是语言的催化剂和加速器。
新词语的大量出现,就是语言发展变化一个非常重要的具体表现,是社会政治、经济、文化、科学技术等各个领域的发展变革在语言中的体现。请看下面几组数据:
粗略估计近20年中新词新语大约每年增加700~800个,《现代汉语词典》1996年修订版增收新词新语约5000条。(村夫、文华,1999)
我国每年新产生的词语大概有1000多个,也就是说平均每天就会有3个新词“呱呱坠地”。新词语已经成为观察中国社会发展变化的“晴雨表”。(《人民日报》,2003年1月17日,第十六版)
《现代汉语词典》(第五版)与1990年修订本相比,在收词方面,根据近年来社会生活、科学技术以及人们思想观念的发展变化,新增加词语6000余条。增收的词语中,新词语占很大比例。(《新京报》,2005年7月27日)
对每一个新词语来说,都有一个产生、发展的过程,其归宿或者是被广泛接受并长期使用,进入一般词汇甚至是基本词汇,如“同比”,已被收入《现代汉语词典》(第五版);或者是没有被广泛接受,在语言的实际运用中被自然淘汰或经过竞争逐渐被另一个词语取而代之,如“大哥大”被“手机”取代;或者完成其历史使命而潜藏起来,如文革中广为流行的大量词语。对新词语的全面研究,应该包括以上全部内容。追溯新词语的产生,实际上就是新词语的词源研究,发现新词语并观察其在语言使用中的发展变化过程和最终归宿,就是对新词语的监测研究。
监测研究本质上是一种历时研究,是监视和检测研究对象在时间轴的不同点上的不同状态,并预测其发展趋势,比如气象监测,就是对天气现象进行实时监视和检测,根据得到的数据和变化规律,可以预测未来的天气变化情况。自然科学上的监测如此,语言研究中的监测同样如此。通过对新词语的监测研究,可以追溯新词语的词源,可以为新词语词典的编纂提供翔实的、可靠的、量化的参考数据,用以确定哪些词语应该收入词典,哪些词语暂时不宜收入词典,同时也为语言规划和语言规范化提供参考。
《新华新词语词典》(2003年版)主编周洪波先生在接受媒体采访时,将新词语入选该词典的标准明确为三点:“必然是20世纪90年代以来出现的;‘不求系统不求平衡’,只要是老百姓使用的频率高,越多越好;要有前瞻性”。(《中国青年报》2003年1月14日)对第三条标准“前瞻性”,有的学者提出了不同的看法,认为“难以判断或保证前瞻的准确性”(陶炼,2004)。我们认为,如果这种“前瞻性”是建立在对语言进行充分的、科学的监测基础上的,就应该积极倡导。因为滞后性是词典的一个先天的弱点,这个弱点在传媒技术发展普及和语言以加速度变化发展的今天显得尤其突出。报刊杂志中的许多词语在词典中找不到,中国人有时候可以通过语感和已有的语言知识包括背景知识推知其义,但是对把汉语作为第二语言的学习者来说,这无疑是一件让他们痛苦和头疼的事情。因此,我们认为,词典,特别是新词语词典,在考虑收词标准时,应该具有适当的、科学的前瞻性,这是语言发展的需要,也是语言教学,特别是对外汉语教学实践的需要。
二、新词语监测研究的可行性
新词语的监测研究实际上一直在进行中。新词语词典的编纂,首先就是要发现和甄别哪些是新词语,这种发现和甄别新词语的过程就是一种监测,只不过这种监测主要是通过人工方式不定期地随机进行的。
1984年,吕叔湘把随机查阅两天的《文汇报》中得出的32个新词语,以及平时阅读报刊时记下的部分新词新义进行整理,提出“大家来关心新词语”(周洪波,1995),吕先生所做的实际上就是一种手工方式的随机监测。1986年开始在《语文建设》上连载的“新词新语新用法”也是这种监测的成果。
《新华新词语词典》(2003年版)的前言中介绍,这部词典的编纂,试行了开放式运作方式:一是与读者互动,除了组织专门班子收集新词语资料外,还通过《文汇报》、《辽宁经济日报》向读者征集新词语。二是与专家互动,收录的新词语是从搜集到的一万多条词语中经过专家反复研究斟酌遴选出来的,所有百科条目的释文均由相关专业学者编写并经辞书编纂专家打磨的。三是滚动修订,计划以后每隔一年对词典进行一次修订,使这部词典保持常出常新的面貌。主编周洪波先生在北京语言大学应用语言学研究所的一次报告中也说,他们在词典编纂的过程中一个很重要的工作内容就是每天看十几种不同的报纸,目的就是发现新词语。同时在网上、报刊上向广大读者征集新词语,这实际上也是在进行手工方式的新词语监测。网上和报刊上征集的方式,实际上是呼吁更多的人参与到新词语的监测中来,最大限度地避免漏收应收的词条。收集到的词语是否都进入词典,第二条中说明词典收入的词语是专家从一万多条词语中经过“反复研究斟酌遴选出来的”。这里的“反复斟酌遴选”的标准是什么,并没有明确说明。但是,现在还没有对新词语进行大规模历时考察和检测的研究,这种“反复斟酌遴选”恐怕只能是或主要是凭专家的经验和语感。
很显然,这种人工随机的监测方式已很难适应语言发展的现实。随着计算机技术和语料库语言学理论和方法的发展,实现计算机对新词语的监测已经成为可能。
张普1998年提出了流通度理论,随后对大规模真实文本语料库、动态语言知识更新等问题作了一系列的论述,搭建了基于动态流通语料库的动态语言知识更新理论体系和应用研究框架。(王强军,2005)2004年6月30日,“国家语言资源监测与研究中心(平面媒体)”揭牌成立,将对包括报纸、图书、期刊在内的平面媒体的国家语言资源进行监测与研究,标志着我对平面媒体语言资源开始实行动态管理。随后又陆续建立了有声媒体、网络媒体、教育教材、海外华人社区4个监测与研究中心。每个中心都将建设一个动态流通语料库和相应的监测管理系统,利用现代化信息处理手段,对现代汉语进行动态定量分析和统计,新词语的监测,必将成为国家语言资源监测的重要内容之一。
动态流通语料库的理论和方法为实现语言的监测研究提供了理论和方法的支持。建立大规模真实文本的历时语料库是实现语言监测研究的前提。张普提出衡量一个语料库是否是历时语料库,有四条基本原则,即:
(1)是否是动态语料库
语料库必须是一个开放的语料库,活语料库。其语料的采集是动态的,其库容量将逐步逼近测量种族的信息量。
(2)语料库的文本是否具有量化的流通度属性
所有语料都来源于大众传媒,都具有采用不同计算方法的与传媒特色相应的流通度属性。其量化的属性值也是动态的。
(3)语料库的深加工是否基于动态的加工方法
语料的加工方法也是动态的。随着语料的动态采集,语料也进行动态的加工。语料是历时的,加工也是历时的。
(4)是否取得动态的加工结果
语料的加工结果也是动态的和历时的。即其量化的统计结果不是一个点,而是由无数量化的点构成的一条线,一条可以观察到历时变化的曲线。
北京语言大学应用语言学研究所的DCC语料库目前已经积累了2001年至今15种主流报纸的近20亿字的语料,是典型的历时动态流通语料库,也是进行新词语监测最理想的语料库,因为新词语最早主要就是出现在报纸媒体中。但是因为语料的时间跨度只有五年,作为一种实验性研究,我们这里更强调历时的时间跨度,因而采用了网上的人民日报检索查询系统,检索了1995年至2004年十年间的语料,以一年作为一个共时点,对《新华新词语词典》(2003)收录的五个新词语进行了历时考察。系统检索结果返回的是检索对象出现的篇次,而不是频次,更不是流通度,但是却能够近似地反映词语使用和流通的变化情况。我们考察的五个新词语是:同比、受众、轻轨/城铁、充电1(本义)/充电2(新义)。并根据它们每年出现的篇次绘制出该词语的历时变化曲线(走势图)。
三、五个新词语1995-2004十年间的历时变化曲线
图1至图4分别是“同比”“受众”“轻轨”“城铁”和“充电”五个新词语1995-2004十年间的使用情况的历时变化曲线。
同比:动词。跟以往同一时期相比,多指跟上一年同一时期相比。(现代汉语词典,第5版)
“同比”是“比去年同期”(也可以是“和去年同期相比”或“和上年同期相比”等形式)的缩略形式,“同比”的出现是语言使用的经济原则作用的结果。周洪波先生在最初听人说及这个词时曾“拍案叫绝”,并且说“我们应该轻松愉快地迎接它、品评它还要站在前边积极地倡导它。”(周洪波,1994)那时他把“同比”称为“待显词语”,即刚露面的新词语。今天通过我们的历时变化曲线图可以看出,它已经彻底地浮出水面,不但广为使用,而且已经堂而皇之地进入了《现代汉语词典》(第5版)。
受众:名词。新闻媒体的传播对象和各种文化、艺术作品的接受者,包括读者、听众和观众等。(现代汉语词典,第5版)
“受众”应该是随着传媒技术的发展应运而生的一个词语。传统传媒的读者、听众和观众其中的任何一个都不能单独胜任表达现代代大众传媒的接受者。可以说,“受众”是适应时代发展的产物。
图3显示,“轻轨”从1995年就出现在《人民日报》的语料中,而“城铁”直到2002年才在《人民日报》中出现,并且经历了一个陡升的过程到2004年又骤降为零。
“充电”是科技术语进入通用词语的一个实例。“充电1”是本义的用法:把直流电源接到蓄电池的两极上,使蓄电池获得放电能力。也泛指用其他方式补充电能。“充电2”是它的新义新用法:比喻通过学习补充知识、提高技能等。
从图4中我们可以看出,“充电1”的历时变化曲线基本上呈水平型,说明这个意义上的用法比较稳定。而“充电2”的历时变化曲线则明显呈现出上升甚至陡升的趋势,说明这个新义新用法经历了一个从出现到逐渐被大多数人接受和使用的过程。
四、几点启示
以上对几个新词语的历时考察虽然只是一种尝试,我们所用的数据只是新词语出现的篇次,但是,通过这些词语的历时变化曲线,我们可以得到很多有益的启示:
(1)利用动态流通语料库对新词语进行历时考察不但可行,而且是一项非常有意义的工作。当语料的覆盖面足够广,历时跨度足够大时,我们就可以追溯到新词语的词源。为每个新词语建立一个词语档案将可以从设想变成现实。以后的社会学、文化学研究和历时语言学、特别是词源学研究将更便捷也更科学,学者再不必像今日研究古代俗语词那样从文献中爬梳剔抉耗神费力而事倍功半了。(李建国,2004)
(2)被广泛接受和使用的新词语有着共同的历时变化曲线类型。如果我们把“比去年同期”和“充电1”的历时变化曲线称为水平型,“同比”“受众”“轻轨”“充电2”的历时变化曲线称为上升型,我们可以大胆地预测,上升型是新词语的一种典型历时曲线类型,而水平型是大多数一般词语的典型历时曲线类型。
新词语的上升型曲线,说明这些新词语都经历了一个从刚刚出现很少人使用到逐渐被更多的多人接受并广泛使用的过程。这几个词语都已收入《现代汉语词典》第5版,如果我们可以把这作为它们已经进入一般词语的标准的话,我们可以得出这样的结论:一个能够最终进入一般词语的新词语,其历时变化都会呈现为这种上升型的曲线。我们甚至可以预言这几个词语曲线将来的变化趋势将会在达到一定高度之后逐渐呈水平型延伸,就像作为参照的“比去年同期”和“充电1”的曲线类型一样,说明它们已经发展成熟,成为使用稳定的一般词语。这种历时变化曲线,生动地展示了一个词语从初生到发展成熟的过程。通过对历时流通度曲线的观察,我们可以计算一个词语的成熟度。随着分词技术和未登录词识别技术的不断进步,加上对未登录词语的历时监测和绘制历时流通度曲线,不但可以实现新词语的自动识别,而且可以判断甚至预测新词语的发展趋势,为新词语词典的编纂和语言规范化(语言规范的任务已不再是匡谬正俗,而应当是对语言变化的评价和抉择。(戴昭铭,1998))提供可靠的、量化的、科学的数据支持。
(3)张普(2003)曾经指出,历时流通度曲线的研究将是一门很有意思的学问。除了上面提到的可以用于新词语的自动识别,一个词语在流通度上的陡升或陡降,可能都反映着社会生活的某种变化或者新技术新事物的诞生。词语特别是新词语,从某种程度上说,是社会变化的晴雨表。而历时流通度曲线则向我们直观地展示了这种变化。北京语言大学应用语言学研究所每年发布的中国主流报纸十大流行语,就是一个很好的例子。如果我们把这种历时跨度增加,通过考察十年甚至二十年间词语特别是新词语的历时流通度曲线变化,简直就可以得到一部生动的社会发展变迁的历史纪录。
(4)如果从新词语的监测扩大到对一般词语的监测,可以随时掌握语言变化的情况,不但可以监测新出现了哪些词语,还可以监测哪些词语被逐渐淘汰了,这对汉语的本体研究和汉语教学都有非常重要的意义。
通过对新词语的监测,我们真切地感受到,语言是有生命的。一个新词语的出现,就是语言王国里一个新生命的诞生,是茁壮成长还是中途夭折,要受语言内部发展规律和外部使用环境的双重制约。它们同自然界的生命一样,也要遵从“优胜劣汰,适者生存”的法则。
参考文献:
[1]程娟.新词新义对比研究[J].世界汉语教学,2001,(4).
[2]村夫、文华.新词新语——汉语中的新家族[J].新闻出版交流,1999,(6).
[3]戴昭铭.规范语言学探索[M].上海:上海三联书店,1998.
[4]高永伟.近20年英语国家对新词的研究[J].外语与外语教学,1998,(11).
[5]李建国.新词语词典编纂的理论思考[J].辞书研究,2004,(4).
[6]苏新春、黄启庆.新词语的成熟与规范词典的选录标准——谈《现代汉语词典》(二〇〇二年增补本)的“附录新词”[J].辞书研究,2003,(3).
[7]隋岩、张普.1997中文报纸媒体流通度分析[A].计算语言学文集[C].北京:清华大学出版社,1999.
[8]陶炼.对《新华新词语词典》(2003年版)修订的一些建议[J].辞书研究,2004,(6).
[9]王强军.信息技术领域新术语提取研究[M].呼和浩特:内蒙古人民出版社,2005.
[10]徐通锵.语言论[M].长春:东北师范大学出版社,1997.
[11]于根元.应用语言学前沿问题[M].北京:中国经济出版社,2006.
[12]张普.关于大规模真实文本语料库的几点理论思考[J].语言文字应用,1999,(1).
[13]张普.关于语感与流通度的思考[J].语言教学与研究,1999,(2).
[14]张普.关于网络时代语言规划的思考[J].语言研究,1999,(3).
[15]张普.信息处理用动态语言知识更新的总体思考[J].语言文字应用,2000,(2).
[16]张普.关于控制论与动态语言知识更新的思考[J].语言文字应用,2001,(4).
[17]张普.主持人的话[J].语言文字应用,2000,(2).
[18]张普.基于DCC的流行语动态跟踪与辅助发现研究[A].第7届全国计算语言学联席学术会议论文集[C].北京:清华大学出版社,2003.
[19]张普、石定果.论历时中包含有共时与共时中包含有历时[J].语言教学与研究,2003,(3).
[20]周洪波.从隐性到显性:新词语产生的重要途径──兼谈新词新语词典的编写[J].辞书研究,1994,(4).
[21]周洪波.近年来汉语新词语的整理和研究[A].语言文字应用研究论文集[C].北京:语文出版社,1995.
[22]人民网搜索频道.人民日报报系搜索:http://search.people.com.cn/was40/people/GB/index.htm#3.
(刘长征,北京语言大学汉语速成学院)
本文以历时中包含有共时,共时中包含有历时的相对时间观为哲学基础,利用动态流通语料库的理论和方法,探讨在共时状态的现代汉语中对新词语进行历时考察与监测的问题。
一般来说,实用意义(有别于词典学的意义)上的“新词”有两个含义:第一,从时间参照角度来说,新词可以是“出现在某一时间段内或自某一时间点以来所首次出现的词汇”。第二,从蓝本参照角度来说,新词指的是“某一词典、一些词典或所有现有词典未曾收录的词汇”。(高永伟1998)
本文针对新词语的历时考察,是指对已经收入新词语词典的新词语进行回溯性的调查和定量分析,追溯新词语的词源,通过新词语的历时流通度曲线的变化,分析总结新词语的使用情况和发展变化规律。新词语监测是指发现新词语并对其使用情况进行实时监测,也包括发现旧词语的新义和新用法,为研究语言的发展变化,也为语言规范化和辞典编纂,特别是新词语词典的收词标准提供量化的科学依据。为了行文方便,以下统称为新词语监测研究。
一、语言研究的相对时间观和新词语监测研究
时间观是语言研究方法论的一个重要基础(徐通锵,1997)。张普、石定果(2003)提出了语言研究中历时中包含有共时,共时中包含有历时的相对时间观,指出,共时状态是语言的空间态,历时状态是时间态,语言的时间状态和空间状态都是客观存在着的,从时间与空间的双重状态来观察分析,才是全方位的。历时状态最重要的特征包括:
1.活着的语言永远在变化,变化是绝对的,历时状态是语言的时间态,历时研究是对语言的时间态进行观察、分析、对比、评估等等。这种观察、分析、对比、评估,原则上可以是就整个语言系统进行的,也可以是就某些个别语言要素来进行的。
2.语言历时状态的演进是不平衡的,不同的要素发展变化速度并不相同,例如词汇、语义要素变化相对较快,语音、语法要素变化相对较慢。即使变化较快的词汇要素,内部也体现了差异性,基本词汇部分相对稳定,一般词汇则比较活跃,术语和某些新闻词语的更新尤其迅速。
3.语言是社会交际的工具,语言的发展变化基本上与社会的发展变化同步,社会政治、经济、文化、科学技术等各个领域的任何急剧变革都是语言的催化剂和加速器。
新词语的大量出现,就是语言发展变化一个非常重要的具体表现,是社会政治、经济、文化、科学技术等各个领域的发展变革在语言中的体现。请看下面几组数据:
粗略估计近20年中新词新语大约每年增加700~800个,《现代汉语词典》1996年修订版增收新词新语约5000条。(村夫、文华,1999)
我国每年新产生的词语大概有1000多个,也就是说平均每天就会有3个新词“呱呱坠地”。新词语已经成为观察中国社会发展变化的“晴雨表”。(《人民日报》,2003年1月17日,第十六版)
《现代汉语词典》(第五版)与1990年修订本相比,在收词方面,根据近年来社会生活、科学技术以及人们思想观念的发展变化,新增加词语6000余条。增收的词语中,新词语占很大比例。(《新京报》,2005年7月27日)
对每一个新词语来说,都有一个产生、发展的过程,其归宿或者是被广泛接受并长期使用,进入一般词汇甚至是基本词汇,如“同比”,已被收入《现代汉语词典》(第五版);或者是没有被广泛接受,在语言的实际运用中被自然淘汰或经过竞争逐渐被另一个词语取而代之,如“大哥大”被“手机”取代;或者完成其历史使命而潜藏起来,如文革中广为流行的大量词语。对新词语的全面研究,应该包括以上全部内容。追溯新词语的产生,实际上就是新词语的词源研究,发现新词语并观察其在语言使用中的发展变化过程和最终归宿,就是对新词语的监测研究。
监测研究本质上是一种历时研究,是监视和检测研究对象在时间轴的不同点上的不同状态,并预测其发展趋势,比如气象监测,就是对天气现象进行实时监视和检测,根据得到的数据和变化规律,可以预测未来的天气变化情况。自然科学上的监测如此,语言研究中的监测同样如此。通过对新词语的监测研究,可以追溯新词语的词源,可以为新词语词典的编纂提供翔实的、可靠的、量化的参考数据,用以确定哪些词语应该收入词典,哪些词语暂时不宜收入词典,同时也为语言规划和语言规范化提供参考。
《新华新词语词典》(2003年版)主编周洪波先生在接受媒体采访时,将新词语入选该词典的标准明确为三点:“必然是20世纪90年代以来出现的;‘不求系统不求平衡’,只要是老百姓使用的频率高,越多越好;要有前瞻性”。(《中国青年报》2003年1月14日)对第三条标准“前瞻性”,有的学者提出了不同的看法,认为“难以判断或保证前瞻的准确性”(陶炼,2004)。我们认为,如果这种“前瞻性”是建立在对语言进行充分的、科学的监测基础上的,就应该积极倡导。因为滞后性是词典的一个先天的弱点,这个弱点在传媒技术发展普及和语言以加速度变化发展的今天显得尤其突出。报刊杂志中的许多词语在词典中找不到,中国人有时候可以通过语感和已有的语言知识包括背景知识推知其义,但是对把汉语作为第二语言的学习者来说,这无疑是一件让他们痛苦和头疼的事情。因此,我们认为,词典,特别是新词语词典,在考虑收词标准时,应该具有适当的、科学的前瞻性,这是语言发展的需要,也是语言教学,特别是对外汉语教学实践的需要。
二、新词语监测研究的可行性
新词语的监测研究实际上一直在进行中。新词语词典的编纂,首先就是要发现和甄别哪些是新词语,这种发现和甄别新词语的过程就是一种监测,只不过这种监测主要是通过人工方式不定期地随机进行的。
1984年,吕叔湘把随机查阅两天的《文汇报》中得出的32个新词语,以及平时阅读报刊时记下的部分新词新义进行整理,提出“大家来关心新词语”(周洪波,1995),吕先生所做的实际上就是一种手工方式的随机监测。1986年开始在《语文建设》上连载的“新词新语新用法”也是这种监测的成果。
《新华新词语词典》(2003年版)的前言中介绍,这部词典的编纂,试行了开放式运作方式:一是与读者互动,除了组织专门班子收集新词语资料外,还通过《文汇报》、《辽宁经济日报》向读者征集新词语。二是与专家互动,收录的新词语是从搜集到的一万多条词语中经过专家反复研究斟酌遴选出来的,所有百科条目的释文均由相关专业学者编写并经辞书编纂专家打磨的。三是滚动修订,计划以后每隔一年对词典进行一次修订,使这部词典保持常出常新的面貌。主编周洪波先生在北京语言大学应用语言学研究所的一次报告中也说,他们在词典编纂的过程中一个很重要的工作内容就是每天看十几种不同的报纸,目的就是发现新词语。同时在网上、报刊上向广大读者征集新词语,这实际上也是在进行手工方式的新词语监测。网上和报刊上征集的方式,实际上是呼吁更多的人参与到新词语的监测中来,最大限度地避免漏收应收的词条。收集到的词语是否都进入词典,第二条中说明词典收入的词语是专家从一万多条词语中经过“反复研究斟酌遴选出来的”。这里的“反复斟酌遴选”的标准是什么,并没有明确说明。但是,现在还没有对新词语进行大规模历时考察和检测的研究,这种“反复斟酌遴选”恐怕只能是或主要是凭专家的经验和语感。
很显然,这种人工随机的监测方式已很难适应语言发展的现实。随着计算机技术和语料库语言学理论和方法的发展,实现计算机对新词语的监测已经成为可能。
张普1998年提出了流通度理论,随后对大规模真实文本语料库、动态语言知识更新等问题作了一系列的论述,搭建了基于动态流通语料库的动态语言知识更新理论体系和应用研究框架。(王强军,2005)2004年6月30日,“国家语言资源监测与研究中心(平面媒体)”揭牌成立,将对包括报纸、图书、期刊在内的平面媒体的国家语言资源进行监测与研究,标志着我对平面媒体语言资源开始实行动态管理。随后又陆续建立了有声媒体、网络媒体、教育教材、海外华人社区4个监测与研究中心。每个中心都将建设一个动态流通语料库和相应的监测管理系统,利用现代化信息处理手段,对现代汉语进行动态定量分析和统计,新词语的监测,必将成为国家语言资源监测的重要内容之一。
动态流通语料库的理论和方法为实现语言的监测研究提供了理论和方法的支持。建立大规模真实文本的历时语料库是实现语言监测研究的前提。张普提出衡量一个语料库是否是历时语料库,有四条基本原则,即:
(1)是否是动态语料库
语料库必须是一个开放的语料库,活语料库。其语料的采集是动态的,其库容量将逐步逼近测量种族的信息量。
(2)语料库的文本是否具有量化的流通度属性
所有语料都来源于大众传媒,都具有采用不同计算方法的与传媒特色相应的流通度属性。其量化的属性值也是动态的。
(3)语料库的深加工是否基于动态的加工方法
语料的加工方法也是动态的。随着语料的动态采集,语料也进行动态的加工。语料是历时的,加工也是历时的。
(4)是否取得动态的加工结果
语料的加工结果也是动态的和历时的。即其量化的统计结果不是一个点,而是由无数量化的点构成的一条线,一条可以观察到历时变化的曲线。
北京语言大学应用语言学研究所的DCC语料库目前已经积累了2001年至今15种主流报纸的近20亿字的语料,是典型的历时动态流通语料库,也是进行新词语监测最理想的语料库,因为新词语最早主要就是出现在报纸媒体中。但是因为语料的时间跨度只有五年,作为一种实验性研究,我们这里更强调历时的时间跨度,因而采用了网上的人民日报检索查询系统,检索了1995年至2004年十年间的语料,以一年作为一个共时点,对《新华新词语词典》(2003)收录的五个新词语进行了历时考察。系统检索结果返回的是检索对象出现的篇次,而不是频次,更不是流通度,但是却能够近似地反映词语使用和流通的变化情况。我们考察的五个新词语是:同比、受众、轻轨/城铁、充电1(本义)/充电2(新义)。并根据它们每年出现的篇次绘制出该词语的历时变化曲线(走势图)。
三、五个新词语1995-2004十年间的历时变化曲线
图1至图4分别是“同比”“受众”“轻轨”“城铁”和“充电”五个新词语1995-2004十年间的使用情况的历时变化曲线。
同比:动词。跟以往同一时期相比,多指跟上一年同一时期相比。(现代汉语词典,第5版)
“同比”是“比去年同期”(也可以是“和去年同期相比”或“和上年同期相比”等形式)的缩略形式,“同比”的出现是语言使用的经济原则作用的结果。周洪波先生在最初听人说及这个词时曾“拍案叫绝”,并且说“我们应该轻松愉快地迎接它、品评它还要站在前边积极地倡导它。”(周洪波,1994)那时他把“同比”称为“待显词语”,即刚露面的新词语。今天通过我们的历时变化曲线图可以看出,它已经彻底地浮出水面,不但广为使用,而且已经堂而皇之地进入了《现代汉语词典》(第5版)。
受众:名词。新闻媒体的传播对象和各种文化、艺术作品的接受者,包括读者、听众和观众等。(现代汉语词典,第5版)
“受众”应该是随着传媒技术的发展应运而生的一个词语。传统传媒的读者、听众和观众其中的任何一个都不能单独胜任表达现代代大众传媒的接受者。可以说,“受众”是适应时代发展的产物。
图3显示,“轻轨”从1995年就出现在《人民日报》的语料中,而“城铁”直到2002年才在《人民日报》中出现,并且经历了一个陡升的过程到2004年又骤降为零。
“充电”是科技术语进入通用词语的一个实例。“充电1”是本义的用法:把直流电源接到蓄电池的两极上,使蓄电池获得放电能力。也泛指用其他方式补充电能。“充电2”是它的新义新用法:比喻通过学习补充知识、提高技能等。
从图4中我们可以看出,“充电1”的历时变化曲线基本上呈水平型,说明这个意义上的用法比较稳定。而“充电2”的历时变化曲线则明显呈现出上升甚至陡升的趋势,说明这个新义新用法经历了一个从出现到逐渐被大多数人接受和使用的过程。
四、几点启示
以上对几个新词语的历时考察虽然只是一种尝试,我们所用的数据只是新词语出现的篇次,但是,通过这些词语的历时变化曲线,我们可以得到很多有益的启示:
(1)利用动态流通语料库对新词语进行历时考察不但可行,而且是一项非常有意义的工作。当语料的覆盖面足够广,历时跨度足够大时,我们就可以追溯到新词语的词源。为每个新词语建立一个词语档案将可以从设想变成现实。以后的社会学、文化学研究和历时语言学、特别是词源学研究将更便捷也更科学,学者再不必像今日研究古代俗语词那样从文献中爬梳剔抉耗神费力而事倍功半了。(李建国,2004)
(2)被广泛接受和使用的新词语有着共同的历时变化曲线类型。如果我们把“比去年同期”和“充电1”的历时变化曲线称为水平型,“同比”“受众”“轻轨”“充电2”的历时变化曲线称为上升型,我们可以大胆地预测,上升型是新词语的一种典型历时曲线类型,而水平型是大多数一般词语的典型历时曲线类型。
新词语的上升型曲线,说明这些新词语都经历了一个从刚刚出现很少人使用到逐渐被更多的多人接受并广泛使用的过程。这几个词语都已收入《现代汉语词典》第5版,如果我们可以把这作为它们已经进入一般词语的标准的话,我们可以得出这样的结论:一个能够最终进入一般词语的新词语,其历时变化都会呈现为这种上升型的曲线。我们甚至可以预言这几个词语曲线将来的变化趋势将会在达到一定高度之后逐渐呈水平型延伸,就像作为参照的“比去年同期”和“充电1”的曲线类型一样,说明它们已经发展成熟,成为使用稳定的一般词语。这种历时变化曲线,生动地展示了一个词语从初生到发展成熟的过程。通过对历时流通度曲线的观察,我们可以计算一个词语的成熟度。随着分词技术和未登录词识别技术的不断进步,加上对未登录词语的历时监测和绘制历时流通度曲线,不但可以实现新词语的自动识别,而且可以判断甚至预测新词语的发展趋势,为新词语词典的编纂和语言规范化(语言规范的任务已不再是匡谬正俗,而应当是对语言变化的评价和抉择。(戴昭铭,1998))提供可靠的、量化的、科学的数据支持。
(3)张普(2003)曾经指出,历时流通度曲线的研究将是一门很有意思的学问。除了上面提到的可以用于新词语的自动识别,一个词语在流通度上的陡升或陡降,可能都反映着社会生活的某种变化或者新技术新事物的诞生。词语特别是新词语,从某种程度上说,是社会变化的晴雨表。而历时流通度曲线则向我们直观地展示了这种变化。北京语言大学应用语言学研究所每年发布的中国主流报纸十大流行语,就是一个很好的例子。如果我们把这种历时跨度增加,通过考察十年甚至二十年间词语特别是新词语的历时流通度曲线变化,简直就可以得到一部生动的社会发展变迁的历史纪录。
(4)如果从新词语的监测扩大到对一般词语的监测,可以随时掌握语言变化的情况,不但可以监测新出现了哪些词语,还可以监测哪些词语被逐渐淘汰了,这对汉语的本体研究和汉语教学都有非常重要的意义。
通过对新词语的监测,我们真切地感受到,语言是有生命的。一个新词语的出现,就是语言王国里一个新生命的诞生,是茁壮成长还是中途夭折,要受语言内部发展规律和外部使用环境的双重制约。它们同自然界的生命一样,也要遵从“优胜劣汰,适者生存”的法则。
参考文献:
[1]程娟.新词新义对比研究[J].世界汉语教学,2001,(4).
[2]村夫、文华.新词新语——汉语中的新家族[J].新闻出版交流,1999,(6).
[3]戴昭铭.规范语言学探索[M].上海:上海三联书店,1998.
[4]高永伟.近20年英语国家对新词的研究[J].外语与外语教学,1998,(11).
[5]李建国.新词语词典编纂的理论思考[J].辞书研究,2004,(4).
[6]苏新春、黄启庆.新词语的成熟与规范词典的选录标准——谈《现代汉语词典》(二〇〇二年增补本)的“附录新词”[J].辞书研究,2003,(3).
[7]隋岩、张普.1997中文报纸媒体流通度分析[A].计算语言学文集[C].北京:清华大学出版社,1999.
[8]陶炼.对《新华新词语词典》(2003年版)修订的一些建议[J].辞书研究,2004,(6).
[9]王强军.信息技术领域新术语提取研究[M].呼和浩特:内蒙古人民出版社,2005.
[10]徐通锵.语言论[M].长春:东北师范大学出版社,1997.
[11]于根元.应用语言学前沿问题[M].北京:中国经济出版社,2006.
[12]张普.关于大规模真实文本语料库的几点理论思考[J].语言文字应用,1999,(1).
[13]张普.关于语感与流通度的思考[J].语言教学与研究,1999,(2).
[14]张普.关于网络时代语言规划的思考[J].语言研究,1999,(3).
[15]张普.信息处理用动态语言知识更新的总体思考[J].语言文字应用,2000,(2).
[16]张普.关于控制论与动态语言知识更新的思考[J].语言文字应用,2001,(4).
[17]张普.主持人的话[J].语言文字应用,2000,(2).
[18]张普.基于DCC的流行语动态跟踪与辅助发现研究[A].第7届全国计算语言学联席学术会议论文集[C].北京:清华大学出版社,2003.
[19]张普、石定果.论历时中包含有共时与共时中包含有历时[J].语言教学与研究,2003,(3).
[20]周洪波.从隐性到显性:新词语产生的重要途径──兼谈新词新语词典的编写[J].辞书研究,1994,(4).
[21]周洪波.近年来汉语新词语的整理和研究[A].语言文字应用研究论文集[C].北京:语文出版社,1995.
[22]人民网搜索频道.人民日报报系搜索:http://search.people.com.cn/was40/people/GB/index.htm#3.
(刘长征,北京语言大学汉语速成学院)