论文部分内容阅读
摘要:英语中同义词非常丰富,它们一方面使英语表达精确细致,另一方面却给英语学习者带来了很多的困难。而传统的教学法在指导学生对英语近义词的实际使用方面有所欠缺。使用语料库索引对英语中的近义词进行辨析是有效的方法,现以great和large这两个同义词为例,利用BNC 语料库对其词频、类联接及语义韵进行定量统计和分析,希望能为英语学习者区分及有效使用这组同义词提供指导。该方法是对借助英语词典学习英语词汇方法的有效补充。
关键词:同义词;BNC语料库;词频;语义韵
作者简介:金朋荪(1954-),男,北京人,华北电力大学外国语学院,教授;李京徽(1980-),女,吉林吉林人,华北电力大学外国语学院硕士研究生。(北京 102206)
中图分类号:H313.2 文献标识码:A 文章编号:1007-0079(2011)05-0194-02
英语是世界上使用最广泛的一种语言,它的词汇量非常大。其中,同义词的大量存在为中国学习者习得地道的英语设置了很大的障碍。大多数中国学习者只是根据词典中,尤其是英汉词典中给出的义项,就认为同义词是完全等同的,不区分语境而随意混用它们。而传统的同义词辨析方法多依赖于直觉或经验,一般的语言学习者在实际的运用中很难得其要领,产生了大量不得体的用法。本文拟从语料库语言学的角度,以同义词great和large为例,在BNC语料库进行检索,通过观察它们的检索行,发现同义词great和large在不同语域中的词频分布不相同,搭配的信息值也有区别,且它们都有各自的常用搭配,从而揭示了great和large的词频、类联接和语义韵的不同点。
一、BNC语料库
杨百翰大学BNC语料库是目前网络可直接使用的最大的语料库,它是英国牛津出版社、朗文出版公司、钱伯斯—哈洛普出版公司、牛津大学计算机服务中心、兰卡斯特大学英语计算机中心以及大英图书馆等联合开发的大型语料库,于1994年建成。该语料库书面语与口语并存,词容量超过一亿,由4124篇具有广泛代表性的现代英式英语文本构成。包括国家和地方各类报纸杂志、理论书籍、通俗小说,其中书面语占90%,口语占10%。
二、基于语料库的语言差异性探究
1.同义词 great 和large 在不同语域中词频分布
语域是语言学研究的一个重要概念,它是指人们在实际的语言活动中,出于交际的需要,根据具体的话题、不同的说话对象等变量而产生的一种语言变体。同义词虽然意思大体相同,但也存在内在意义上的细微差异,这种差异会在不同的语域中呈现出不一样的分布特征,因此,如果统计它们在不同的语域中的频率分布差异,就能够将它们区分开来。
同义词Large 和great词义的区别,一般的词典类工具书都是介绍它们各自的词义,但对其语域的分布频率的说明却很少涉及。从BNC语料库检索出来的频率来看(表1、表2),可发现great 和large 在不同的语域中分布的情况有很大的差异。
以每百万词作为统计单位,great和large在口语语域分布的频率各自为383.39次和119.53次,说明相对于large来说,great更经常出现在口语语域中。同样,在报纸语域中,great 比large 出现的频率要高得多。
以上的频率分布统计表明,如果仅仅从概念意义或句法功能入手去辨析同义词,是很难分辨其细微特征的。但是,如果能够从语域分布的角度来观察,就会很容易发现同义词在不同语域的分布概率也是不同的,知道其各自的分布特征,可以帮助学习者依据不同语域来选择正确的单词,使学习者对同义词的辨析由感性上升到理性。
2.同义词 great 和large 搭配词的计算
词语搭配是指词与词共现使用的一种语言现象,是高度循环使用的词语组合,是词语间的典型共现行为。学习和掌握词语搭配,是外语学习者的一个重要学习内容。辛克莱指出:词语搭配的典型性是由搭配的概率决定的,任何搭配都是可能出现的,只不过有一些更为恰当。MI值(Mutual Information Score,共现信息值)是指在一个语料库中共现的两个单词,一个单词出现的频数能够预测或提供另一个单词出现的概率。MI值越大,说明两个词的搭配强度也越高。语料库的词语搭配研究中通常把MI值等于或大于3的词作为显著搭配词。
从great搭配词(见表3)来看,great与deal、majority、importance、fun等单词形成常用搭配,表示“强度大”;great的另一个主要含义是“伟大的、优秀的、杰出的等”,与Britain和man等形成固定或常用搭配。
由表4可知,large分别与表示数量的number、amount、quantities、sums和表示范围的extent、area、scale等名词形成常用搭配词。
通过对以上两个同义词的搭配共现信息值的计算,可以清楚地了解到MI值对词汇搭配的研究具有重要的意义。首先,它能够让学习者较为直观地了解单词的最常用搭配,即英语母语者在实际的语言交际中对该词的使用范式;其次,它能够帮助学习者剔除那些语义合理而在实际的语言使用中却很少使用的搭配,从而帮助英语学习者掌握地道的英语。需要指出的是,MI值高的搭配词不一定和节点词的共现频率就高。如果一个单词在某个语料库出现的频率很低,且出现时又都与节点词搭配,那么它和节点词的共现信息值就会很高,这时当然不能说这两个单词是常用搭配,因为这种现象也有可能是由语料库的特殊性质决定的。通常在求共现信息值时,要求单词在该语料库的出现频率必须大于10。为了弥补共现信息值的不足,还需要进行假设性检验,来支持典型搭配,最常使用的是T检验。此处因所搭配的名词每百万出现的频率都很高,故在本文中,T值检验暂省略。
3.同义词 great和large 语义韵特征
在对同义词的辨析过程中,学习者较容易掌握单词的概念意义,但对单词的附加意义却很难掌握。因为词汇的附加修辞意义是在概念意义的基础上附加了很多态度信息、文化信息、环境信息和其它一些综合信息,具有心理学的含义。语言中有很多词,自身就带有态度的附加功能,如褒义词、贬义词等。然而更多的词却是概念意义单一的词,其态度内涵比较隐晦,需要研究它的共现语境,语义韵的概念便应运而生了。语义韵是指一些词吸引与该词语义特点相同或相似的词项,因为经常共现,就使该词(节点词)被“传染”上了有关的语义特点,它所在的语境也呈现出一种特殊的语义氛围。以event 和affair为例,event在类联接“形容词+ 名词”中,此处的形容词多为中性词,如particular、national、social、unique、popular、significant等。而与affair搭配的形容词可以分为两类:一类是中性意义的,如simple、great、large、little、complex、serious 等;另一类是具有消极意义的,如passionate、intimate、blue、homosexual、lesbian 等,呈现出一种错综的语义特征。从表3和表4中可以总结出同义词great和large所搭配的名词多为中性词,因此不能用语义韵区分该组同义词。
三、结语
同义词教学与使用一直是教师与学生的难题。在以往的同义词教学过程中,教师多应用内在反省方式或主观经验来告诉学生词汇的细微区别,这种方式很难让学生真正领会同义词的真实使用方法,又没有什么说服力。笔者通过使用BNC语料库区分同义词great 和large,说明借助语料库可以帮助学习者理清同义词的细微差别,目的在于指出语料库应用可以弥补传统教学不足,且易操作,学生也较容易掌握,这种方法能够帮助学习者达到事半功倍的效果。
参考文献:
[1]Firth J R.Papers in Linguistics 1934 - 1951[M].London:Oxford University Press,1957.
[2]Sinclair J.Beginning the study of lexis [A].In memory of J.R.Firth,1966.
[3]桂世春,杨惠中.语料库语言学导论[M].上海:上海外语教育出版社,2002.
[4]卫乃兴.词语搭配的界定与研究体系[M].上海:上海交通大学出版社,2002.
(责任编辑:沈清)
关键词:同义词;BNC语料库;词频;语义韵
作者简介:金朋荪(1954-),男,北京人,华北电力大学外国语学院,教授;李京徽(1980-),女,吉林吉林人,华北电力大学外国语学院硕士研究生。(北京 102206)
中图分类号:H313.2 文献标识码:A 文章编号:1007-0079(2011)05-0194-02
英语是世界上使用最广泛的一种语言,它的词汇量非常大。其中,同义词的大量存在为中国学习者习得地道的英语设置了很大的障碍。大多数中国学习者只是根据词典中,尤其是英汉词典中给出的义项,就认为同义词是完全等同的,不区分语境而随意混用它们。而传统的同义词辨析方法多依赖于直觉或经验,一般的语言学习者在实际的运用中很难得其要领,产生了大量不得体的用法。本文拟从语料库语言学的角度,以同义词great和large为例,在BNC语料库进行检索,通过观察它们的检索行,发现同义词great和large在不同语域中的词频分布不相同,搭配的信息值也有区别,且它们都有各自的常用搭配,从而揭示了great和large的词频、类联接和语义韵的不同点。
一、BNC语料库
杨百翰大学BNC语料库是目前网络可直接使用的最大的语料库,它是英国牛津出版社、朗文出版公司、钱伯斯—哈洛普出版公司、牛津大学计算机服务中心、兰卡斯特大学英语计算机中心以及大英图书馆等联合开发的大型语料库,于1994年建成。该语料库书面语与口语并存,词容量超过一亿,由4124篇具有广泛代表性的现代英式英语文本构成。包括国家和地方各类报纸杂志、理论书籍、通俗小说,其中书面语占90%,口语占10%。
二、基于语料库的语言差异性探究
1.同义词 great 和large 在不同语域中词频分布
语域是语言学研究的一个重要概念,它是指人们在实际的语言活动中,出于交际的需要,根据具体的话题、不同的说话对象等变量而产生的一种语言变体。同义词虽然意思大体相同,但也存在内在意义上的细微差异,这种差异会在不同的语域中呈现出不一样的分布特征,因此,如果统计它们在不同的语域中的频率分布差异,就能够将它们区分开来。
同义词Large 和great词义的区别,一般的词典类工具书都是介绍它们各自的词义,但对其语域的分布频率的说明却很少涉及。从BNC语料库检索出来的频率来看(表1、表2),可发现great 和large 在不同的语域中分布的情况有很大的差异。
以每百万词作为统计单位,great和large在口语语域分布的频率各自为383.39次和119.53次,说明相对于large来说,great更经常出现在口语语域中。同样,在报纸语域中,great 比large 出现的频率要高得多。
以上的频率分布统计表明,如果仅仅从概念意义或句法功能入手去辨析同义词,是很难分辨其细微特征的。但是,如果能够从语域分布的角度来观察,就会很容易发现同义词在不同语域的分布概率也是不同的,知道其各自的分布特征,可以帮助学习者依据不同语域来选择正确的单词,使学习者对同义词的辨析由感性上升到理性。
2.同义词 great 和large 搭配词的计算
词语搭配是指词与词共现使用的一种语言现象,是高度循环使用的词语组合,是词语间的典型共现行为。学习和掌握词语搭配,是外语学习者的一个重要学习内容。辛克莱指出:词语搭配的典型性是由搭配的概率决定的,任何搭配都是可能出现的,只不过有一些更为恰当。MI值(Mutual Information Score,共现信息值)是指在一个语料库中共现的两个单词,一个单词出现的频数能够预测或提供另一个单词出现的概率。MI值越大,说明两个词的搭配强度也越高。语料库的词语搭配研究中通常把MI值等于或大于3的词作为显著搭配词。
从great搭配词(见表3)来看,great与deal、majority、importance、fun等单词形成常用搭配,表示“强度大”;great的另一个主要含义是“伟大的、优秀的、杰出的等”,与Britain和man等形成固定或常用搭配。
由表4可知,large分别与表示数量的number、amount、quantities、sums和表示范围的extent、area、scale等名词形成常用搭配词。
通过对以上两个同义词的搭配共现信息值的计算,可以清楚地了解到MI值对词汇搭配的研究具有重要的意义。首先,它能够让学习者较为直观地了解单词的最常用搭配,即英语母语者在实际的语言交际中对该词的使用范式;其次,它能够帮助学习者剔除那些语义合理而在实际的语言使用中却很少使用的搭配,从而帮助英语学习者掌握地道的英语。需要指出的是,MI值高的搭配词不一定和节点词的共现频率就高。如果一个单词在某个语料库出现的频率很低,且出现时又都与节点词搭配,那么它和节点词的共现信息值就会很高,这时当然不能说这两个单词是常用搭配,因为这种现象也有可能是由语料库的特殊性质决定的。通常在求共现信息值时,要求单词在该语料库的出现频率必须大于10。为了弥补共现信息值的不足,还需要进行假设性检验,来支持典型搭配,最常使用的是T检验。此处因所搭配的名词每百万出现的频率都很高,故在本文中,T值检验暂省略。
3.同义词 great和large 语义韵特征
在对同义词的辨析过程中,学习者较容易掌握单词的概念意义,但对单词的附加意义却很难掌握。因为词汇的附加修辞意义是在概念意义的基础上附加了很多态度信息、文化信息、环境信息和其它一些综合信息,具有心理学的含义。语言中有很多词,自身就带有态度的附加功能,如褒义词、贬义词等。然而更多的词却是概念意义单一的词,其态度内涵比较隐晦,需要研究它的共现语境,语义韵的概念便应运而生了。语义韵是指一些词吸引与该词语义特点相同或相似的词项,因为经常共现,就使该词(节点词)被“传染”上了有关的语义特点,它所在的语境也呈现出一种特殊的语义氛围。以event 和affair为例,event在类联接“形容词+ 名词”中,此处的形容词多为中性词,如particular、national、social、unique、popular、significant等。而与affair搭配的形容词可以分为两类:一类是中性意义的,如simple、great、large、little、complex、serious 等;另一类是具有消极意义的,如passionate、intimate、blue、homosexual、lesbian 等,呈现出一种错综的语义特征。从表3和表4中可以总结出同义词great和large所搭配的名词多为中性词,因此不能用语义韵区分该组同义词。
三、结语
同义词教学与使用一直是教师与学生的难题。在以往的同义词教学过程中,教师多应用内在反省方式或主观经验来告诉学生词汇的细微区别,这种方式很难让学生真正领会同义词的真实使用方法,又没有什么说服力。笔者通过使用BNC语料库区分同义词great 和large,说明借助语料库可以帮助学习者理清同义词的细微差别,目的在于指出语料库应用可以弥补传统教学不足,且易操作,学生也较容易掌握,这种方法能够帮助学习者达到事半功倍的效果。
参考文献:
[1]Firth J R.Papers in Linguistics 1934 - 1951[M].London:Oxford University Press,1957.
[2]Sinclair J.Beginning the study of lexis [A].In memory of J.R.Firth,1966.
[3]桂世春,杨惠中.语料库语言学导论[M].上海:上海外语教育出版社,2002.
[4]卫乃兴.词语搭配的界定与研究体系[M].上海:上海交通大学出版社,2002.
(责任编辑:沈清)