论文部分内容阅读
摘 要: Douglas Biber创建的多维度多特征模型(Multi-dimensional/Multi-featureanalysis)是迄今为止涉及语言特征最多、分类最细致的研究语域变异的方法,在国内外逐渐被广大学者所认可并得到了广泛应用。
关键词: 多维度多特征模型 语体 语域变异
1988年,Biber创建了多维度多特征分析模型(Multi-dimensional/Multi-featureanalysis),以语料库和计算机统计技术为基础,通过分析语言特征的“共现”(co-occurring)模式,对语域变异进行多维度分析,揭示各语体之间的差异。自建立以来,多维度多特征模型在语料库语言学研究中逐渐受到重视并占有独特的地位。
一、多维度多特征模型的建立
1988年,Biber在其论著Variation across Speech and Writing中,从英国LOB语料库(Lancaster-Oslo/Bergen Corpus)和LLC语料库(London-Lund Corpus)中选取了23种口笔语语域的文本,对文本中的67种语言特征进行了调查。通过因子分析法,他对这些语言特征在口笔语语域中的共现情况加以分析,并确立了最终的五个维度:信息性/参与性、叙述性/非叙述性、指代明确性/指代有赖场景、说服性、抽象性/非抽象性。
二、国外研究概况
Biber(1992)运用其多维度框架对索马里语的口笔语语域进行了分析。该研究从26种口笔语语域中选取了279篇语料分析其65种语言特征的分布,并用因子分析法统计出其五个维度值。与其他语言的分析结果相同,该研究表明仅凭一个维度无法充分描述口笔语语域间的关联。此外,Biber总结了以往研究,发现任何语言都有一个或更多的口语维度。这些维度不能完全确定口笔语之间的差异,但是它们与我们通常所认为的口笔语语域有关。
2002年,在总结了以往研究的不足之处后,Biber与Conrad,Reppen等几个学者一起将目光投向对大学口语和书面语的多维度分析。该研究选取了TOEFL2000口语及书面语学术语言语料库(Written Academic Language Corpus)为研究对象,对其进行多维度分析。研究表明,口语语域和书面语语域间存在本质性的差异。所有口语语料都具有显著的交互性,所指依赖情境,且多数表现出个人化风格;所有笔语语料都具有信息密集的特点,非叙事性,所指清楚且多为非个人化语言。
2008年,Van Rooy,B.运用Biber的多维度模型对南非学习者书面语体进行了研究。研究选取了南非英语学习者(简称BlSAfE)写作语料库,即以茨瓦纳语为母语的英语学习者语料库(简称TLE),并以标准英语参考语料库LOCNESS为对比参照,分析了其中的67种语言特征,讨论了本土化和系统化的存在性。研究发现,LOCNESS中的书面语具有更高的信息性和信息密度,句法结构更复杂,关系的衔接性更好,并且有更多的专业化意义。通过对两种语料库中系数变异的对比,研究者总结出二者有相似的变异范围。从表面上看,TLE在不同维度上与LOCNESS似乎都有很高的相似性,但更为细致地考察揭示出很多差异,这些差异证实了基于个体特征对比的研究发现:TLE书面语中,信息密度较低且信息多以假设方式提出。这就表明许多语体上的相似性和信息处理策略受口语语域的影响,但又与口语体有明显不同。最后,研究者总结认为南非英语属于英语语言的变体之一。
2010年,Rooy又与Terblanche等学者一起将多维度多特征模型运用到东非英语的语域分析中。研究从国际英语语料库(International Corpus of English,ICE)中选择了东非英语部分作为研究语料。研究结果表明,国际英语语料库东非英语子库中的语域变异程度并不低于Biber(1988)的研究结果。然而,该研究亦称东非英语也显示出其独特的语体特征:东非英语的表达更具有正式性,特别是在所指清楚/所指有赖场景维度,抽象性/非抽象性维度及信息性维度更是如此。
三、国内研究概况
2001年,雷秀云、杨惠中讨论了基于语料库的研究方法的优点及重要性,介绍了Biber的MD/MF模型,并从JDEST语料库及LOB语料库中抽取了部分语料,利用MD/MF模型对其进行分析,对照学术英语(EAP)语体及其他一些书面英语语体的差异。这些语料共分23个语体,其中学术英语语体9个,一般英语语体14个。本研究调查了Biber所定义的各维度所包含的语言特征在该样本中的频率,得出所有文体在6个维度上的因素分数,并以此为基础,将所分析的23个语体分为三组,即学术英语、小说和中间语体。研究发现,学术英语注重信息生成、叙述性不强、所指有赖情景、劝诱性较弱、即时性较弱。小说性质恰好相反,而中间语体这些性质较中性化;但在维度五“抽象/非抽象语体”上,学术英语位置最高,是最抽象的,中间语体次之,小说抽象程度最低。
2002年,马广惠利用Biber的理论模式对中美两国大学生英语作文的语言特征进行了对比研究,并对其中存在的差异进行了解释。研究数据包括中美大学生英语作文共98篇,作文均涉及校园、人物、人生、社会、生活、自然、文化等各方面的话题。对比分析结果显示,两者在九个语言特征的使用上存在显著性差异。中国学生的英语作文使用较多的第二人称代词、语篇虚词、连词和形容词;美国学生的英语作文比较长,使用较多的because状语从句、that引导的宾语从句、that引导的定语从句和说服动词。总体上说,中国学生的作文反映了征文特点,具有信息性和正式性;美国学生的作文表现出了更强的口语体修辞特征、较强的个性化特征和先主后补的特点。
2004年,武姜生将多维度模式应用于对学术交流e-mail的文本分析中。本研究在分析一系列“共现”性语言特征的基础上,确立了4个功能维度。然后,分析了学术交流e-mail在这4个维度上所呈现的文体特征,并将这些文体特征与其所反映的语境特点相联系。结果显示,学术交流性电子邮件信息性、论说性强,语法结构“零散”,具有一定互动性,作者认为这些特点与学术交流及e-mail迅捷、方便的特点相互吻合。对学术交流e-mail的文体分析表明基于语料库的MD模式是文体研究的有效方法。它的应用可以较客观地揭示语体在多种功能维度上的文体特征。语体通过同其他语体比较所表现出的不同风格特征的显著性可以由其维度分数精确地描述出来。 2012年,潘瓃对中国非英语专业本科生和研究生书面语体进行了多特征和多维度的调查研究。该研究采用多维度宏观分析和多特征微观分析相结合的方法,从五个维度对比分析了四个中国英语学习者书面语语料库与LOCNESS之间的语体差异。该研究自建了四个总文本数为1872篇、总量约为35.7万词的中国非英语专业学习者书面语语料库,包括研究生议论文库(GA)、研究生信函库(GL)、本科生议论文库(UGA)和本科生信函库(UGL)。研究发现:与美国大学生议论文相比,中国学习者书面语体的交互性和说服性较强,信息性、叙事性、指代明确性和抽象性都偏低。研究揭示出中国学习者的整体信息整合能力比较薄弱,也证实中国学习者作文确实存在明显的“口语化”倾向。在使用与特定交际功能相关的语言特征时,中国学习者表现出不同程度的偏离。研究还显示出学习者内部的语体意识差异很大。
四、结语
Biber所创建的多维度多特征分析模型现了语域分析的多维化,在二语习得研究中有很高的应用价值。
参考文献:
[1]Biber,D.1988.Variation across Speech and Writing[M].Cambridge:CUP.
[2]Biber,D.1992.On the complexity of discourse complexity:A multidimensional analysis[J].Discourse Process 15(2):133-163.
[3]Biber,D.,S.Conrad,R.Reppen,P.Byrd
关键词: 多维度多特征模型 语体 语域变异
1988年,Biber创建了多维度多特征分析模型(Multi-dimensional/Multi-featureanalysis),以语料库和计算机统计技术为基础,通过分析语言特征的“共现”(co-occurring)模式,对语域变异进行多维度分析,揭示各语体之间的差异。自建立以来,多维度多特征模型在语料库语言学研究中逐渐受到重视并占有独特的地位。
一、多维度多特征模型的建立
1988年,Biber在其论著Variation across Speech and Writing中,从英国LOB语料库(Lancaster-Oslo/Bergen Corpus)和LLC语料库(London-Lund Corpus)中选取了23种口笔语语域的文本,对文本中的67种语言特征进行了调查。通过因子分析法,他对这些语言特征在口笔语语域中的共现情况加以分析,并确立了最终的五个维度:信息性/参与性、叙述性/非叙述性、指代明确性/指代有赖场景、说服性、抽象性/非抽象性。
二、国外研究概况
Biber(1992)运用其多维度框架对索马里语的口笔语语域进行了分析。该研究从26种口笔语语域中选取了279篇语料分析其65种语言特征的分布,并用因子分析法统计出其五个维度值。与其他语言的分析结果相同,该研究表明仅凭一个维度无法充分描述口笔语语域间的关联。此外,Biber总结了以往研究,发现任何语言都有一个或更多的口语维度。这些维度不能完全确定口笔语之间的差异,但是它们与我们通常所认为的口笔语语域有关。
2002年,在总结了以往研究的不足之处后,Biber与Conrad,Reppen等几个学者一起将目光投向对大学口语和书面语的多维度分析。该研究选取了TOEFL2000口语及书面语学术语言语料库(Written Academic Language Corpus)为研究对象,对其进行多维度分析。研究表明,口语语域和书面语语域间存在本质性的差异。所有口语语料都具有显著的交互性,所指依赖情境,且多数表现出个人化风格;所有笔语语料都具有信息密集的特点,非叙事性,所指清楚且多为非个人化语言。
2008年,Van Rooy,B.运用Biber的多维度模型对南非学习者书面语体进行了研究。研究选取了南非英语学习者(简称BlSAfE)写作语料库,即以茨瓦纳语为母语的英语学习者语料库(简称TLE),并以标准英语参考语料库LOCNESS为对比参照,分析了其中的67种语言特征,讨论了本土化和系统化的存在性。研究发现,LOCNESS中的书面语具有更高的信息性和信息密度,句法结构更复杂,关系的衔接性更好,并且有更多的专业化意义。通过对两种语料库中系数变异的对比,研究者总结出二者有相似的变异范围。从表面上看,TLE在不同维度上与LOCNESS似乎都有很高的相似性,但更为细致地考察揭示出很多差异,这些差异证实了基于个体特征对比的研究发现:TLE书面语中,信息密度较低且信息多以假设方式提出。这就表明许多语体上的相似性和信息处理策略受口语语域的影响,但又与口语体有明显不同。最后,研究者总结认为南非英语属于英语语言的变体之一。
2010年,Rooy又与Terblanche等学者一起将多维度多特征模型运用到东非英语的语域分析中。研究从国际英语语料库(International Corpus of English,ICE)中选择了东非英语部分作为研究语料。研究结果表明,国际英语语料库东非英语子库中的语域变异程度并不低于Biber(1988)的研究结果。然而,该研究亦称东非英语也显示出其独特的语体特征:东非英语的表达更具有正式性,特别是在所指清楚/所指有赖场景维度,抽象性/非抽象性维度及信息性维度更是如此。
三、国内研究概况
2001年,雷秀云、杨惠中讨论了基于语料库的研究方法的优点及重要性,介绍了Biber的MD/MF模型,并从JDEST语料库及LOB语料库中抽取了部分语料,利用MD/MF模型对其进行分析,对照学术英语(EAP)语体及其他一些书面英语语体的差异。这些语料共分23个语体,其中学术英语语体9个,一般英语语体14个。本研究调查了Biber所定义的各维度所包含的语言特征在该样本中的频率,得出所有文体在6个维度上的因素分数,并以此为基础,将所分析的23个语体分为三组,即学术英语、小说和中间语体。研究发现,学术英语注重信息生成、叙述性不强、所指有赖情景、劝诱性较弱、即时性较弱。小说性质恰好相反,而中间语体这些性质较中性化;但在维度五“抽象/非抽象语体”上,学术英语位置最高,是最抽象的,中间语体次之,小说抽象程度最低。
2002年,马广惠利用Biber的理论模式对中美两国大学生英语作文的语言特征进行了对比研究,并对其中存在的差异进行了解释。研究数据包括中美大学生英语作文共98篇,作文均涉及校园、人物、人生、社会、生活、自然、文化等各方面的话题。对比分析结果显示,两者在九个语言特征的使用上存在显著性差异。中国学生的英语作文使用较多的第二人称代词、语篇虚词、连词和形容词;美国学生的英语作文比较长,使用较多的because状语从句、that引导的宾语从句、that引导的定语从句和说服动词。总体上说,中国学生的作文反映了征文特点,具有信息性和正式性;美国学生的作文表现出了更强的口语体修辞特征、较强的个性化特征和先主后补的特点。
2004年,武姜生将多维度模式应用于对学术交流e-mail的文本分析中。本研究在分析一系列“共现”性语言特征的基础上,确立了4个功能维度。然后,分析了学术交流e-mail在这4个维度上所呈现的文体特征,并将这些文体特征与其所反映的语境特点相联系。结果显示,学术交流性电子邮件信息性、论说性强,语法结构“零散”,具有一定互动性,作者认为这些特点与学术交流及e-mail迅捷、方便的特点相互吻合。对学术交流e-mail的文体分析表明基于语料库的MD模式是文体研究的有效方法。它的应用可以较客观地揭示语体在多种功能维度上的文体特征。语体通过同其他语体比较所表现出的不同风格特征的显著性可以由其维度分数精确地描述出来。 2012年,潘瓃对中国非英语专业本科生和研究生书面语体进行了多特征和多维度的调查研究。该研究采用多维度宏观分析和多特征微观分析相结合的方法,从五个维度对比分析了四个中国英语学习者书面语语料库与LOCNESS之间的语体差异。该研究自建了四个总文本数为1872篇、总量约为35.7万词的中国非英语专业学习者书面语语料库,包括研究生议论文库(GA)、研究生信函库(GL)、本科生议论文库(UGA)和本科生信函库(UGL)。研究发现:与美国大学生议论文相比,中国学习者书面语体的交互性和说服性较强,信息性、叙事性、指代明确性和抽象性都偏低。研究揭示出中国学习者的整体信息整合能力比较薄弱,也证实中国学习者作文确实存在明显的“口语化”倾向。在使用与特定交际功能相关的语言特征时,中国学习者表现出不同程度的偏离。研究还显示出学习者内部的语体意识差异很大。
四、结语
Biber所创建的多维度多特征分析模型现了语域分析的多维化,在二语习得研究中有很高的应用价值。
参考文献:
[1]Biber,D.1988.Variation across Speech and Writing[M].Cambridge:CUP.
[2]Biber,D.1992.On the complexity of discourse complexity:A multidimensional analysis[J].Discourse Process 15(2):133-163.
[3]Biber,D.,S.Conrad,R.Reppen,P.Byrd