论文部分内容阅读
【摘要】语料库语言学是一个年轻而富有朝气的新兴学科。它的诞生与计算机的飞速发展有着非常紧密的关系。语料库应用于外语教学,是利用计算机强大的检索、统计和处理语料的能力,从大规模的语料资源中提取符合要求的语言篇章或结构进行分析、对比和总结等。本文就语料库科学的发展情况,国内外俄语语料库的发展现状及前景展开讨论,并提出相关的问题和思考。
【关键词】单语语料库 外语 教学
【基金项目】2012年中国石油大学(华东)校级教学改革项目资助:(项目编号JY-A201219)基于俄语语料库条件的俄语课堂教学与课外语言实践相结合的应用型教学模式探索。2013年中国石油大学(华东)校级大学生创新项目资助:(项目编号20131294)小型科技俄语平行语料库应用研究。
【中图分类号】G64 【文献标识码】A 【文章编号】2095-3089(2015)02-0110-02
1.引言
上个世纪,伴随着计算机科学的迅猛发展,促生了一系列计算机交叉学科。语料库语言学也是那个时代的产物。年轻的语料库语言学彰顯着它强大的生命力和竞争力,在短短的二十多年里,成为现代语言学研究的新宠。世界上的语料库语言学研究发展很快,尤其是英语语料库逐渐成熟。然而,俄语语料库的研究沉寂滞后,关注点单一且缺乏成熟的理论和实践经验。近年来,我国俄语界对语料库的研究主要是:以俄罗斯的计算语言学传统理论为依据,在工程语言学和机器翻译这些数理学科领域取得一些成果;另一方面是宏观地讨论俄罗斯的俄语语料库建设情况和瞻望我国俄语语料库未来的发展方向(许汉成2005)。这两个方面的研究虽然都是俄语语料库研讨的范围,但是却不是建设语料库和应用语料库的实际内容,可公开使用的俄语语料库的建设及基于俄语语料库辅助教学和研究的应用研究还在摸索中。
2.俄语语料库发展
20世纪80年代,语料库语言学的研究进入发展期。世界范围内语料库的建设和研究人员在最近几年里呈现出迅猛的发展势头,在世界各地建立了一些大型采集各种语料、不同层次、包含多种标注信息、以不同方式进行标注的语料库。俄罗斯国内自建的大型俄语单语语料库——“二十世纪俄文报刊语料库(комьютерный корпус текстов русских газет конца XX века,简称КГТ)”和规模最大的俄罗斯国家语料库(НКРЯ)——也在近几十年引起了俄罗斯国内学界的重视,并逐渐成为俄罗斯计算语言学研究的新热点。在我国,俄语语料库的探讨和研究起步较其他语种晚。笔者以“语料库”和各个语种作关键词在维普期刊资源网上分别进行了检索和统计,得到了下列数据(图1)。从相关数据来看,相比英、汉、日语语料库的建设工作,俄语语料库研究建设空间大,同时难度也大。
俄罗斯国内最早构思建立俄语语料库的学者是俄罗斯学者Л.Н.Засорина,她领导编制的规模为100万词的语料库,包含了每篇为2000词的文章,共500篇,涵盖了4个不同的类型。其中大众报刊类占24%、文艺小说类占25%、人文科学和科技类占24%、戏剧类为27%。根据这个语料库,Засорина于1977年编撰了一部《俄语频率词典》。但这个语料库结构不合理、规模较小,且当时俄语报刊较多涉及意识形态方面的信息,故据此语料库统计的词汇频率可信度不高。之后建立的语料库中,最早进行标注的俄语语料库是1985年由В.М.Андрющенко和А.П.Ершов领导的全面启动的俄语机器储备库(Машинный фонд русского языка),可惜最终没能完全建成,只留下了各类文本达到5000万词的规模,具有一套粗放的标注集,并采用通行的标准完成了部分语料的标注。而世界范围内最早建立、影响最久的俄语语料库是瑞典大学乌普萨拉斯托夫研究系在Lennart Lonngren教授领导下产生的乌普萨拉俄语语料库。利用该语料库的统计数据,编撰了《现代俄语频率词典》。由于该语料库未经形态还原和词法标注,因此不利于直接进行词汇语法信息的检索。但是该语料库对文本来源与类型、标题、段落、句子、专有词、大小写、数字、非俄语字符和标点等等因素进行了严格的区分标注。在实用价值方面具有很高的意义。
这些俄语语料库虽然服务于具体的语言学研究,但是在俄罗斯国家范围内一直没有权威的经过系统的语言学加工的俄语语料库。直到本世纪初,俄罗斯国内语言学家们普遍意识到了建设俄语语料库的必要性和重要性,并迅速投入了各种语料库的建设中,以便能尽快在俄语语料库中搜寻实用的语料资源。并由此产生了不少收录各种各样语料、具有不同处理层次、包含各种标注信息、以不同方式标注的语料库相继出现了。如1所示,这些有代表性的语料库进入了俄语研究者的视野,并且这些语料库都可以部分公开,供人们自由访问,检索。这些通过语言加工的现代大型语料库能够为语言研究者提供客观翔实的语言证据。
这些语料库给世界各国俄语研究工作者提供了无比丰富的语言资源。借助语料库,人们可以通过检索获取科学的数据,对许多几乎成为定论的语言规律开展新的认识和分析,从而产生许多新的语言学思想。语言本身是复杂的,观察语言现象时不能轻率处之,借助语料库可以帮助我们更客观地,全面地,量化地分析语言,推动语言学的研究进步。
3.语料库应用语言教学
语料库应用于外语教学是20世纪下半叶新兴的外语教学理论,是集语料库、外语教学法和计算机技术为一体的新型交叉学科。语料库的发展对于语言教学产生了很大的影响。首先,根据不同类型的语料库,教师选择课程资料更加丰富。从高频词汇和实例的检索,词汇固定用法总结,到口语、演说语料资源,写作范例等的查找,都比过去容易。其次,语料库本身可以作为语言教学的材料,语料库成为语言教学大纲研制和语言教学方法论研究的基础。
语料库应用在外语教学和外语学习领域是推动应用语言学发展的又一个重要内容。目前,语料库的深加工受到了世界各国学者们的普遍重视,很多国家都在深入探索语料库标注、语料库分析、扩展语料库类型等技术。不仅欧美国家的英语语料库蓬勃地发展,俄罗斯国家也认识到这个学科的重要性。2007年在俄罗斯首都莫斯科举办了“俄语国家语料库和人文教育”国际学术会议(Международная конференция 《Национальн?鄄ый корпус русского языка и проблемы гуманитарного образования》),会议议题涉及教学法革新、语言教学、教材编写、词典编撰和语言测试等等众多内容。 国内俄语语料库应用于俄语教学体系的研究在我国高校已经积极投入试验,目前取得一定成效的主要有黑龙江大学、解放军外国语学院等高校。但是如何更有效地利用语料库辅助俄语专业系统教学工作,尚待学者们的研究和实践。笔者认为,利用语料库辅助语言教学,必须完成以下几件事情:
首先必须明确是否需要自建语料库来辅助教学。这是由具体的语言研究目的和语言教学形式决定的。目前我国还没有成熟的、可公开的俄语语料库,能利用到现成的俄语语料库主要是俄罗斯国家语料库(Национальный корпус русского языка(НКРЯ)),通過对该语料库的实际操作,笔者认为俄语语料库辅助俄语教学可以从以下几个方面开展:
(1)建立丰富的、实用的文本资料库
现今的计算机网络技术发展迅猛,网络资源非常丰富、发达的多媒体计算机技术可以很方便地搜索到人们所需要的资料。然而面对良莠不齐、专业性缺乏的互联网环境,尤其是俄语专业对应资源匮乏的大环境,建立一套合适的语料库是辅助外语教学工作开展的有效途径。将语料库语言学和计算语言学的相关理论和技术应用到俄语语料库建设工作中,建立行之有效的、符合我们专业特色的俄语语料库,继而辅助俄语课程的教学,是非常有必要和明智的,同时也具有实用性和前沿性。
(2)建立有声资源库
语言教学需要鲜活的有声资源辅助。课外文史知识和相关视频、音频、图像资源库的建立能提高学生学习自主性、语言的应用能力和自学语言的能力。目前英语教学语料库已经有了口译和笔译、口语和文本等类型,俄语语料库也可以开设这样的课题,积极利用网络资源和开放式学习平台,根据不同的对象合理安排语言自学任务,从已有的语言资料体系中加工形成实用、开放的有声资源库,利用实践平台,实现分层次、有内容的教与学形式。
(3)建立学习者语料库
语料库辅助语言教学不是研究语言自身的问题,而是一种以语料库为基础将语言研究和语言教学结合,形成交叉研究。目前国内尚没有俄语学习者语料库,而学习者语料库能集中反映非母语者学习者在语言学习的过程中的问题和困难,从而帮助教学者调整和修正教学过程和教学方法。
国内的俄语语料库处在起步阶段,是一个充满希望的研究方向,值得我们教学第一线的教师们积极探讨和研究。
参考文献:
[1]Susan hunston. Corpora in applied linguistics [M]. Cambridge, England. 2002.
[2]桂诗春.基于语料库的英语语言学语体分析[M], 外语教学与研究出版社,2009.
[3]张禄彭,张超静.自建语料库在俄语教学研究中的应用[A],中国俄语教学,2012.8
[4]许汉成.俄语语料库的新发展[A],中国俄语教学,2005.1
[5]于丹红.俄语国家语料库与俄语词汇教学—以одеть和надеть为例[A],俄语学习,2007.6
作者简介:
代霄彦(1980.1-),汉族,女,湖北武汉人,中国石油大学(华东)讲师,研究方向为俄语教学,俄罗斯语言文化。
【关键词】单语语料库 外语 教学
【基金项目】2012年中国石油大学(华东)校级教学改革项目资助:(项目编号JY-A201219)基于俄语语料库条件的俄语课堂教学与课外语言实践相结合的应用型教学模式探索。2013年中国石油大学(华东)校级大学生创新项目资助:(项目编号20131294)小型科技俄语平行语料库应用研究。
【中图分类号】G64 【文献标识码】A 【文章编号】2095-3089(2015)02-0110-02
1.引言
上个世纪,伴随着计算机科学的迅猛发展,促生了一系列计算机交叉学科。语料库语言学也是那个时代的产物。年轻的语料库语言学彰顯着它强大的生命力和竞争力,在短短的二十多年里,成为现代语言学研究的新宠。世界上的语料库语言学研究发展很快,尤其是英语语料库逐渐成熟。然而,俄语语料库的研究沉寂滞后,关注点单一且缺乏成熟的理论和实践经验。近年来,我国俄语界对语料库的研究主要是:以俄罗斯的计算语言学传统理论为依据,在工程语言学和机器翻译这些数理学科领域取得一些成果;另一方面是宏观地讨论俄罗斯的俄语语料库建设情况和瞻望我国俄语语料库未来的发展方向(许汉成2005)。这两个方面的研究虽然都是俄语语料库研讨的范围,但是却不是建设语料库和应用语料库的实际内容,可公开使用的俄语语料库的建设及基于俄语语料库辅助教学和研究的应用研究还在摸索中。
2.俄语语料库发展
20世纪80年代,语料库语言学的研究进入发展期。世界范围内语料库的建设和研究人员在最近几年里呈现出迅猛的发展势头,在世界各地建立了一些大型采集各种语料、不同层次、包含多种标注信息、以不同方式进行标注的语料库。俄罗斯国内自建的大型俄语单语语料库——“二十世纪俄文报刊语料库(комьютерный корпус текстов русских газет конца XX века,简称КГТ)”和规模最大的俄罗斯国家语料库(НКРЯ)——也在近几十年引起了俄罗斯国内学界的重视,并逐渐成为俄罗斯计算语言学研究的新热点。在我国,俄语语料库的探讨和研究起步较其他语种晚。笔者以“语料库”和各个语种作关键词在维普期刊资源网上分别进行了检索和统计,得到了下列数据(图1)。从相关数据来看,相比英、汉、日语语料库的建设工作,俄语语料库研究建设空间大,同时难度也大。
俄罗斯国内最早构思建立俄语语料库的学者是俄罗斯学者Л.Н.Засорина,她领导编制的规模为100万词的语料库,包含了每篇为2000词的文章,共500篇,涵盖了4个不同的类型。其中大众报刊类占24%、文艺小说类占25%、人文科学和科技类占24%、戏剧类为27%。根据这个语料库,Засорина于1977年编撰了一部《俄语频率词典》。但这个语料库结构不合理、规模较小,且当时俄语报刊较多涉及意识形态方面的信息,故据此语料库统计的词汇频率可信度不高。之后建立的语料库中,最早进行标注的俄语语料库是1985年由В.М.Андрющенко和А.П.Ершов领导的全面启动的俄语机器储备库(Машинный фонд русского языка),可惜最终没能完全建成,只留下了各类文本达到5000万词的规模,具有一套粗放的标注集,并采用通行的标准完成了部分语料的标注。而世界范围内最早建立、影响最久的俄语语料库是瑞典大学乌普萨拉斯托夫研究系在Lennart Lonngren教授领导下产生的乌普萨拉俄语语料库。利用该语料库的统计数据,编撰了《现代俄语频率词典》。由于该语料库未经形态还原和词法标注,因此不利于直接进行词汇语法信息的检索。但是该语料库对文本来源与类型、标题、段落、句子、专有词、大小写、数字、非俄语字符和标点等等因素进行了严格的区分标注。在实用价值方面具有很高的意义。
这些俄语语料库虽然服务于具体的语言学研究,但是在俄罗斯国家范围内一直没有权威的经过系统的语言学加工的俄语语料库。直到本世纪初,俄罗斯国内语言学家们普遍意识到了建设俄语语料库的必要性和重要性,并迅速投入了各种语料库的建设中,以便能尽快在俄语语料库中搜寻实用的语料资源。并由此产生了不少收录各种各样语料、具有不同处理层次、包含各种标注信息、以不同方式标注的语料库相继出现了。如1所示,这些有代表性的语料库进入了俄语研究者的视野,并且这些语料库都可以部分公开,供人们自由访问,检索。这些通过语言加工的现代大型语料库能够为语言研究者提供客观翔实的语言证据。
这些语料库给世界各国俄语研究工作者提供了无比丰富的语言资源。借助语料库,人们可以通过检索获取科学的数据,对许多几乎成为定论的语言规律开展新的认识和分析,从而产生许多新的语言学思想。语言本身是复杂的,观察语言现象时不能轻率处之,借助语料库可以帮助我们更客观地,全面地,量化地分析语言,推动语言学的研究进步。
3.语料库应用语言教学
语料库应用于外语教学是20世纪下半叶新兴的外语教学理论,是集语料库、外语教学法和计算机技术为一体的新型交叉学科。语料库的发展对于语言教学产生了很大的影响。首先,根据不同类型的语料库,教师选择课程资料更加丰富。从高频词汇和实例的检索,词汇固定用法总结,到口语、演说语料资源,写作范例等的查找,都比过去容易。其次,语料库本身可以作为语言教学的材料,语料库成为语言教学大纲研制和语言教学方法论研究的基础。
语料库应用在外语教学和外语学习领域是推动应用语言学发展的又一个重要内容。目前,语料库的深加工受到了世界各国学者们的普遍重视,很多国家都在深入探索语料库标注、语料库分析、扩展语料库类型等技术。不仅欧美国家的英语语料库蓬勃地发展,俄罗斯国家也认识到这个学科的重要性。2007年在俄罗斯首都莫斯科举办了“俄语国家语料库和人文教育”国际学术会议(Международная конференция 《Национальн?鄄ый корпус русского языка и проблемы гуманитарного образования》),会议议题涉及教学法革新、语言教学、教材编写、词典编撰和语言测试等等众多内容。 国内俄语语料库应用于俄语教学体系的研究在我国高校已经积极投入试验,目前取得一定成效的主要有黑龙江大学、解放军外国语学院等高校。但是如何更有效地利用语料库辅助俄语专业系统教学工作,尚待学者们的研究和实践。笔者认为,利用语料库辅助语言教学,必须完成以下几件事情:
首先必须明确是否需要自建语料库来辅助教学。这是由具体的语言研究目的和语言教学形式决定的。目前我国还没有成熟的、可公开的俄语语料库,能利用到现成的俄语语料库主要是俄罗斯国家语料库(Национальный корпус русского языка(НКРЯ)),通過对该语料库的实际操作,笔者认为俄语语料库辅助俄语教学可以从以下几个方面开展:
(1)建立丰富的、实用的文本资料库
现今的计算机网络技术发展迅猛,网络资源非常丰富、发达的多媒体计算机技术可以很方便地搜索到人们所需要的资料。然而面对良莠不齐、专业性缺乏的互联网环境,尤其是俄语专业对应资源匮乏的大环境,建立一套合适的语料库是辅助外语教学工作开展的有效途径。将语料库语言学和计算语言学的相关理论和技术应用到俄语语料库建设工作中,建立行之有效的、符合我们专业特色的俄语语料库,继而辅助俄语课程的教学,是非常有必要和明智的,同时也具有实用性和前沿性。
(2)建立有声资源库
语言教学需要鲜活的有声资源辅助。课外文史知识和相关视频、音频、图像资源库的建立能提高学生学习自主性、语言的应用能力和自学语言的能力。目前英语教学语料库已经有了口译和笔译、口语和文本等类型,俄语语料库也可以开设这样的课题,积极利用网络资源和开放式学习平台,根据不同的对象合理安排语言自学任务,从已有的语言资料体系中加工形成实用、开放的有声资源库,利用实践平台,实现分层次、有内容的教与学形式。
(3)建立学习者语料库
语料库辅助语言教学不是研究语言自身的问题,而是一种以语料库为基础将语言研究和语言教学结合,形成交叉研究。目前国内尚没有俄语学习者语料库,而学习者语料库能集中反映非母语者学习者在语言学习的过程中的问题和困难,从而帮助教学者调整和修正教学过程和教学方法。
国内的俄语语料库处在起步阶段,是一个充满希望的研究方向,值得我们教学第一线的教师们积极探讨和研究。
参考文献:
[1]Susan hunston. Corpora in applied linguistics [M]. Cambridge, England. 2002.
[2]桂诗春.基于语料库的英语语言学语体分析[M], 外语教学与研究出版社,2009.
[3]张禄彭,张超静.自建语料库在俄语教学研究中的应用[A],中国俄语教学,2012.8
[4]许汉成.俄语语料库的新发展[A],中国俄语教学,2005.1
[5]于丹红.俄语国家语料库与俄语词汇教学—以одеть和надеть为例[A],俄语学习,2007.6
作者简介:
代霄彦(1980.1-),汉族,女,湖北武汉人,中国石油大学(华东)讲师,研究方向为俄语教学,俄罗斯语言文化。