论文部分内容阅读
【摘要】本文回顾了自20世纪60年代以来语料库的发展:从刚开始库容为100万的书面语语料库,到后来库容为1亿的口笔语语料库;从起初的静态语料库,到后来每年都在增加词容的动态语料库;从发展初期的一般英语语料库到后来根据研究目的不同而建立的特殊用途英语语料库……语料库伴随着语料库语言学的发展不断为语言教学,教材编写,语言研究,词典编撰等提供强有力的支撑。此外,本文界定了名物化,提出并论证了名物化与语篇类型的关系:语篇的正式程度越高,其名物化特征就越明显。
【关键词】语料库 名物化
语料库是语料库语言学研究的基础。就英语语料库而言,语料库可以分为一般英语语料库,特殊用途英语语料库,学习者语料库,国际英语语料库等。不同类别的语料库为词典编撰,语言教学,教材编写,语言研究等提供了有力的支撑。
一、语料库的发展
语料库(corpus)是应用计算机技术对海量自然语言材料进行处理、存储,以供自动检索、索引以及统计分析的大型资料库。1959年,Randolph Quirk宣布建成了Survey of English Usage (SEU) 语料库,该语料库由200篇篇幅为500字符的文本构成,总库容为一百万字符,其中有一半为口语语料,一半为书面语语料;1961年,美国Brown大学创建了Brown Corpus;英国Lancaster大学与挪威Oslo大学、Bergen大学在1978年联合创建了LOB语料库;1975年,以J.Svartvik为首的一批语言学家开始对R.Quirk 建立的 SEU(Survey of English Usage)语料库口语部分做韵律标注,建成了London-Lund Corpus of Spoken English。这些语料库的建设吸引了大批语言学家通过语料库手段对语言进行描写和研究,推动了语料库语言学的发展。1987年,Sinclair 主持完成了COBUILD Corpus 的建设,该语料库库容5亿词,是迄今最大的语料库之一,该库的建成为词典编撰,语法研究,教材编写提供了可靠的语料来源;之后建立的(Birmingham Collection of English Texts)语料库,库容达到730万词次,到1987年增至2000万词次。1994年,英国国家语料库BNC(British National Corpus)建成,该语料库库容1亿词次,收录了4000余篇口语和书面语文本,最大限度的记录了真实运用的语言,是迄今为止最有代表性的当代英语语料库。而BCET再次扩大演变成为一个以2亿词次为起点的开放式英语词库(Bank of English),到1996年底已增至3.2亿词次,且其规模仍在继续扩大。40年间,语料库从库容一百万到库容1亿词次,直至现在成为开放的、动态语料库,语料库借助计算机技术的发展,在飞速的发展,语料库语言学也从1950s 时候的不被看好,到现在蓬勃发展,渗透到应用语言学研究的各个领域。
我国语料库语言学的发展兴起于20世纪70年代末至20世纪80年代初,1982年,杨惠中教授主持建设了交通大学科技英语语料库(JDEST),该语料库为特殊用途英语(English for Specific Purpose 简称 ESP)语料库,由2000个采样单位组成,涉及造船,航空,建筑,数学,物理,化工等多个领域。JDEST的建成方便了后来的语言学习者对科技英语进行词汇、句法结构、语义搭配、篇章分析等方面进行研究,为提高科技英语教学质量做出了重要贡献。20世纪90年代后,随着国内语料库语言学研究的发展,一批学习者语料库先后建立起来,包括中国学习者英语语料库(Chinese Learners English Corpus建成LEC),中国学习者英语口语语料库(College Learners Spoken English Corpus,简称COLSEC) 中国学生英语口语语料库(Spoken and Written English Corpus of Chinese Learners,简称SWECCL),香港科技大学学习者语料库(HKUST Learner Corpus),等等。
二、名物化的界定
名物化(nominalization)指由其他词类(通常为动词和形容词)转化为名词的语法化过程(Richards et al.,2000:309),如move 和movement;real 和reality等。《现代语言学词典》(A Dictionary of Linguistic sand Phonetics)( David Crystal,2011)将名物化定义为“从其他某个词类形成名词的过程或指从一个底层小句得出一个名词短语的派生过程。”人们对名物化的认识不是一蹴而就的,而是在不断认识的过程中形成的。20世纪初,语言学家开始关注名物化现象。Humboldt和Jespersen很早就注意到名物化现象;Lees,Vendler,Zucchi,Heyvaert 也在不同时期对名物化现象进行了深入的研究;之后,聚焦名词化并展开跨语言对比研究的论著也陆续推出。国内,范文芳,刘国辉,朱永生等就语言学不同流派对名物化的研究都给予了不同程度的关注。从形式上来看,名物化大致可以分为四种类型:动名词形式、派生性名词、不定式和名词性小句。而人们一般认为名物化主要是指动词、形容词的派生性名词。
名物化作为一个语言学范畴产生与人们交际的需要紧密相关;同时名物化本身与语篇类型也有着密切的关系。哈桑指出语类即语篇类型,与语境配置(contextual configuration)中的语场有关(王晋军:2003)。而语场在很大程度上决定了交际中词汇的选择和语言的语法特征,因而可以说语篇的类型制约了词汇的选择。除了语音和语法,词汇的选择也对语篇的正式程度有决定性作用。而就名物化来说,笔者认为,语篇的正式程度越高,句子结构越完整,词汇选择越讲究,名物化特征越明显。为了验证该说法,笔者整理、对比了以后缀-ness,-tion,-sion,-ment,-ity,-ee,-ism 结尾的名物化单词在JDEST,BNC,和法律英语语料库(LEC)中所占的比值。这三种语料,就语篇类型的正式性而言,法律英语因涉及国家法律,对词语,搭配,句法结构等的选择最为严谨,是三种语料当中最为正式的语料;科技英语涉及造船,航空,建筑,数学,物理,化工等多个领域中英文版的科学著作、论文、教科书、科技报告等,是三种语料当中次于法律英语较为正式的语料;BNC语料涉及政治,新闻,小说,信件等书面语料,及政府、商业谈判,电视节目,脱口秀等口语语料,是一般英语(General English)的代表,其语篇类型的正式性低于法律英语和科技英语。 名物化单词在三个语料库中所占百分比。从上面表格中所呈现的数据可以看出,名物化单词在法律英语语料库中所占的比例为7.36%,在科技英语语料库中所占的比例为4.02%,在英国国家语料库中所占的比例为2.55%。三个语料库中名物化现象最明显的是语篇类型最为正式的法律英语,其次是科技英语,名物化现象最不明显的是由BNC所代表的一般英语。这些数据恰恰证实了笔者的推断,即,语篇类型与词汇选择有密切关系,语篇的正式程度越高,句子结构越完整,词汇选择越讲究,名物化特征就越明显。
参考文献:
[1]Biber,D.,S.Conrad,et al.Corpus Linguistics.New York, Cambridge University Press.2006.
[2]Chomsky,N.Remarks on nominalization.in Readings in English transformational grammar.Mass,Ginn and Company.1970.
[3]Richatads,J.C.e.al.Longman Dictionary of Language Teaching
【关键词】语料库 名物化
语料库是语料库语言学研究的基础。就英语语料库而言,语料库可以分为一般英语语料库,特殊用途英语语料库,学习者语料库,国际英语语料库等。不同类别的语料库为词典编撰,语言教学,教材编写,语言研究等提供了有力的支撑。
一、语料库的发展
语料库(corpus)是应用计算机技术对海量自然语言材料进行处理、存储,以供自动检索、索引以及统计分析的大型资料库。1959年,Randolph Quirk宣布建成了Survey of English Usage (SEU) 语料库,该语料库由200篇篇幅为500字符的文本构成,总库容为一百万字符,其中有一半为口语语料,一半为书面语语料;1961年,美国Brown大学创建了Brown Corpus;英国Lancaster大学与挪威Oslo大学、Bergen大学在1978年联合创建了LOB语料库;1975年,以J.Svartvik为首的一批语言学家开始对R.Quirk 建立的 SEU(Survey of English Usage)语料库口语部分做韵律标注,建成了London-Lund Corpus of Spoken English。这些语料库的建设吸引了大批语言学家通过语料库手段对语言进行描写和研究,推动了语料库语言学的发展。1987年,Sinclair 主持完成了COBUILD Corpus 的建设,该语料库库容5亿词,是迄今最大的语料库之一,该库的建成为词典编撰,语法研究,教材编写提供了可靠的语料来源;之后建立的(Birmingham Collection of English Texts)语料库,库容达到730万词次,到1987年增至2000万词次。1994年,英国国家语料库BNC(British National Corpus)建成,该语料库库容1亿词次,收录了4000余篇口语和书面语文本,最大限度的记录了真实运用的语言,是迄今为止最有代表性的当代英语语料库。而BCET再次扩大演变成为一个以2亿词次为起点的开放式英语词库(Bank of English),到1996年底已增至3.2亿词次,且其规模仍在继续扩大。40年间,语料库从库容一百万到库容1亿词次,直至现在成为开放的、动态语料库,语料库借助计算机技术的发展,在飞速的发展,语料库语言学也从1950s 时候的不被看好,到现在蓬勃发展,渗透到应用语言学研究的各个领域。
我国语料库语言学的发展兴起于20世纪70年代末至20世纪80年代初,1982年,杨惠中教授主持建设了交通大学科技英语语料库(JDEST),该语料库为特殊用途英语(English for Specific Purpose 简称 ESP)语料库,由2000个采样单位组成,涉及造船,航空,建筑,数学,物理,化工等多个领域。JDEST的建成方便了后来的语言学习者对科技英语进行词汇、句法结构、语义搭配、篇章分析等方面进行研究,为提高科技英语教学质量做出了重要贡献。20世纪90年代后,随着国内语料库语言学研究的发展,一批学习者语料库先后建立起来,包括中国学习者英语语料库(Chinese Learners English Corpus建成LEC),中国学习者英语口语语料库(College Learners Spoken English Corpus,简称COLSEC) 中国学生英语口语语料库(Spoken and Written English Corpus of Chinese Learners,简称SWECCL),香港科技大学学习者语料库(HKUST Learner Corpus),等等。
二、名物化的界定
名物化(nominalization)指由其他词类(通常为动词和形容词)转化为名词的语法化过程(Richards et al.,2000:309),如move 和movement;real 和reality等。《现代语言学词典》(A Dictionary of Linguistic sand Phonetics)( David Crystal,2011)将名物化定义为“从其他某个词类形成名词的过程或指从一个底层小句得出一个名词短语的派生过程。”人们对名物化的认识不是一蹴而就的,而是在不断认识的过程中形成的。20世纪初,语言学家开始关注名物化现象。Humboldt和Jespersen很早就注意到名物化现象;Lees,Vendler,Zucchi,Heyvaert 也在不同时期对名物化现象进行了深入的研究;之后,聚焦名词化并展开跨语言对比研究的论著也陆续推出。国内,范文芳,刘国辉,朱永生等就语言学不同流派对名物化的研究都给予了不同程度的关注。从形式上来看,名物化大致可以分为四种类型:动名词形式、派生性名词、不定式和名词性小句。而人们一般认为名物化主要是指动词、形容词的派生性名词。
名物化作为一个语言学范畴产生与人们交际的需要紧密相关;同时名物化本身与语篇类型也有着密切的关系。哈桑指出语类即语篇类型,与语境配置(contextual configuration)中的语场有关(王晋军:2003)。而语场在很大程度上决定了交际中词汇的选择和语言的语法特征,因而可以说语篇的类型制约了词汇的选择。除了语音和语法,词汇的选择也对语篇的正式程度有决定性作用。而就名物化来说,笔者认为,语篇的正式程度越高,句子结构越完整,词汇选择越讲究,名物化特征越明显。为了验证该说法,笔者整理、对比了以后缀-ness,-tion,-sion,-ment,-ity,-ee,-ism 结尾的名物化单词在JDEST,BNC,和法律英语语料库(LEC)中所占的比值。这三种语料,就语篇类型的正式性而言,法律英语因涉及国家法律,对词语,搭配,句法结构等的选择最为严谨,是三种语料当中最为正式的语料;科技英语涉及造船,航空,建筑,数学,物理,化工等多个领域中英文版的科学著作、论文、教科书、科技报告等,是三种语料当中次于法律英语较为正式的语料;BNC语料涉及政治,新闻,小说,信件等书面语料,及政府、商业谈判,电视节目,脱口秀等口语语料,是一般英语(General English)的代表,其语篇类型的正式性低于法律英语和科技英语。 名物化单词在三个语料库中所占百分比。从上面表格中所呈现的数据可以看出,名物化单词在法律英语语料库中所占的比例为7.36%,在科技英语语料库中所占的比例为4.02%,在英国国家语料库中所占的比例为2.55%。三个语料库中名物化现象最明显的是语篇类型最为正式的法律英语,其次是科技英语,名物化现象最不明显的是由BNC所代表的一般英语。这些数据恰恰证实了笔者的推断,即,语篇类型与词汇选择有密切关系,语篇的正式程度越高,句子结构越完整,词汇选择越讲究,名物化特征就越明显。
参考文献:
[1]Biber,D.,S.Conrad,et al.Corpus Linguistics.New York, Cambridge University Press.2006.
[2]Chomsky,N.Remarks on nominalization.in Readings in English transformational grammar.Mass,Ginn and Company.1970.
[3]Richatads,J.C.e.al.Longman Dictionary of Language Teaching