论文部分内容阅读
摘要:语料库语言学是计算机和语言学的跨学科领域。基于语料库辅助,词汇教学中学习者运用微型文本语料库提供的语境共现界面可以通过观察目标词与周围的词共建短语词块的词汇来研究搭配方式、语法范式、语义及语用功能,从而真正实现在教师指导下进行数据驱动学习(DDL)的词汇学习模式。
关键词:语料库语言学;微型文本;索引;搭配
中图分类号:G642.41 文献标志码:A 文章编号:1674-9324(2013)44-0078-02
语料库是一个按照一定的采样保准采集而来的、能够地表示一种语言或者某语言的一种变体或文类的电子文本集。对语料库进行研究得出的结论可以应用于整个语言、语言变体或文类。语料库的批量呈现界面适合采用概率统计的方法得出结论,因此语料库语言学本质上是实证性的。语料库的主要类型包括通用语料库、专用语料库、共时语料库、历时语料库、口语语料库、笔语语料库、本族语者语料库、学习者语料库、单语语料库和双语、多语语料库。
一、文献回顾
语料库语言学的发展起源于20世纪60年代的英美国家。早期的三大经典语料库为BROWN,LOB和LLC。其中,BROWN语料库是由美国Brown大学根据系统性原则建立的当代美国英语语料库。第二代语料库建于20世纪80年代,由英国Birmingham大学与Collins出版社合作完成,规模达到2000万词次,1987年基于该语料库的Collins Cobuild词典问世了。电子网络语料库兴起于2005年,其特点是在国际互联网上设置检索引擎,将互联网上的语言信息作为一个巨大的、动态的和开放的语料库,典型代表为COCA-Corpus of Contemporary America,美国当代英语语料库。国内语料库的建设兴起于20世纪,其中较有影响力的语料库有中国学习者英语语料库(Chinese Learners’ English Corpus,CLEC)(桂诗春、杨惠中2003)、中国学习者英语口语语料库(College Learners’ Spoken English Corpus,COLSEC)(卫乃兴等2005)、中国大学生英汉汉英口笔译语料库(Parallel Corpus of Chinese EFL Learners)(文秋芳等2008)、CEM(Corpus for English Majors)语料库(中国高校外语专业多语种语料库建设和研究项目组2008)等、英汉双语平行语料库(王克飞等2011)。
二、语料库辅助的词汇教学的理论基础
语言学和语言教学的理论为语料库辅助语言教学提供了夯实的理论基础。Tim Johns和Chris Tribble开创了运用语料库技术辅助语言教学的先例。他们提出数据驱动学习(Data-Driven Learning,DDL)或课堂索引练习(classroom concordancing)(Johns2002)的理念。数据驱动学习的基本理念倡导“以学习者为中心”,让学生自己观察教师事先设计好的教学材料,根据观察进行假设推断,然后再通过相互讨论归纳出答案。认知心理学认为语料库通过其语境共现界面运用一批相同的或相类似的语境信息刺激学生,使得认知图式或者大脑的神经网络得以激活;同时,学生从反复出现的语境共现中挖掘语言意义的背景,归纳出语言的应用规律或规则,逐渐使知识图式化从而进入大脑记忆,然后再通过加工记忆转化为学习者内在的语言系统。现代教育学认为语料库语言学是与计算机科学同步发展的跨学科领域。语料库中的语料真实、自然,内容丰富,能反映最鲜活的语言使用情况。学习者通过观察运用计算机检索手段呈现的海量语言信息,开展深层语言知识结构的研究。语料库检索工具提供的语境共现、词频表、关键词词表也从技术上支持了归纳式教学和探究性学习。在语料库辅助下学生通过观察目标词与周围的词共建短语词块的词汇搭配方式、语法范式、语义及语用功能,能更好地理解和应用词汇。
三、创建微型文本进行索引分析
创建微型文本的必要性不言而喻。首先在教学过程中各个阶段都有独特的目标,教师应根据不同需要量体裁衣,因材施教。然而现有的语料库过于庞大,很难在课堂有限的时间内从语料库中及时找到教学中需要突出的难点。其次,语料库中的语料取材广泛,体裁各样,这就导致语料的难度控制不好,会挫伤学生学习的积极性。因此教师在日常教学中对文本进行难度分级,自行设计分级的教学用语料库,选择合适的语料抽取例句、发放学习材料、编制练习题目,就显得尤为重要。教师可以从大型语料库或自建语料库中进行检索,得到索引行后,将这些索引行保存到一个文件中,然后从这些索引行中抽样保存为一个单独的微型文本。在语料资源来源方面教师可以充分利用免费共享的在线语料库资源。目前网上常用的语料库有Bank of English,其拥有5.6亿词次的当代英国书面语和口语语料库(http://www.collins/co.uk/Corpus/CorpusSearch.aspx);British National Corpus,其拥有1亿词次的书面语和口语(http://corpus.byu.edu/bnc);Corpus of Contemporary American English,4亿词次的当代美国英语书面语语料库(http://wwww.americancorpus.org);Time Magazine Corpus,1亿词次的美国时代周刊的语料库(http://corpus.byu.edu/time/);virtual language Centre,其中包The Starr report,Brown,LOB,SCMP articles,Business
关键词:语料库语言学;微型文本;索引;搭配
中图分类号:G642.41 文献标志码:A 文章编号:1674-9324(2013)44-0078-02
语料库是一个按照一定的采样保准采集而来的、能够地表示一种语言或者某语言的一种变体或文类的电子文本集。对语料库进行研究得出的结论可以应用于整个语言、语言变体或文类。语料库的批量呈现界面适合采用概率统计的方法得出结论,因此语料库语言学本质上是实证性的。语料库的主要类型包括通用语料库、专用语料库、共时语料库、历时语料库、口语语料库、笔语语料库、本族语者语料库、学习者语料库、单语语料库和双语、多语语料库。
一、文献回顾
语料库语言学的发展起源于20世纪60年代的英美国家。早期的三大经典语料库为BROWN,LOB和LLC。其中,BROWN语料库是由美国Brown大学根据系统性原则建立的当代美国英语语料库。第二代语料库建于20世纪80年代,由英国Birmingham大学与Collins出版社合作完成,规模达到2000万词次,1987年基于该语料库的Collins Cobuild词典问世了。电子网络语料库兴起于2005年,其特点是在国际互联网上设置检索引擎,将互联网上的语言信息作为一个巨大的、动态的和开放的语料库,典型代表为COCA-Corpus of Contemporary America,美国当代英语语料库。国内语料库的建设兴起于20世纪,其中较有影响力的语料库有中国学习者英语语料库(Chinese Learners’ English Corpus,CLEC)(桂诗春、杨惠中2003)、中国学习者英语口语语料库(College Learners’ Spoken English Corpus,COLSEC)(卫乃兴等2005)、中国大学生英汉汉英口笔译语料库(Parallel Corpus of Chinese EFL Learners)(文秋芳等2008)、CEM(Corpus for English Majors)语料库(中国高校外语专业多语种语料库建设和研究项目组2008)等、英汉双语平行语料库(王克飞等2011)。
二、语料库辅助的词汇教学的理论基础
语言学和语言教学的理论为语料库辅助语言教学提供了夯实的理论基础。Tim Johns和Chris Tribble开创了运用语料库技术辅助语言教学的先例。他们提出数据驱动学习(Data-Driven Learning,DDL)或课堂索引练习(classroom concordancing)(Johns2002)的理念。数据驱动学习的基本理念倡导“以学习者为中心”,让学生自己观察教师事先设计好的教学材料,根据观察进行假设推断,然后再通过相互讨论归纳出答案。认知心理学认为语料库通过其语境共现界面运用一批相同的或相类似的语境信息刺激学生,使得认知图式或者大脑的神经网络得以激活;同时,学生从反复出现的语境共现中挖掘语言意义的背景,归纳出语言的应用规律或规则,逐渐使知识图式化从而进入大脑记忆,然后再通过加工记忆转化为学习者内在的语言系统。现代教育学认为语料库语言学是与计算机科学同步发展的跨学科领域。语料库中的语料真实、自然,内容丰富,能反映最鲜活的语言使用情况。学习者通过观察运用计算机检索手段呈现的海量语言信息,开展深层语言知识结构的研究。语料库检索工具提供的语境共现、词频表、关键词词表也从技术上支持了归纳式教学和探究性学习。在语料库辅助下学生通过观察目标词与周围的词共建短语词块的词汇搭配方式、语法范式、语义及语用功能,能更好地理解和应用词汇。
三、创建微型文本进行索引分析
创建微型文本的必要性不言而喻。首先在教学过程中各个阶段都有独特的目标,教师应根据不同需要量体裁衣,因材施教。然而现有的语料库过于庞大,很难在课堂有限的时间内从语料库中及时找到教学中需要突出的难点。其次,语料库中的语料取材广泛,体裁各样,这就导致语料的难度控制不好,会挫伤学生学习的积极性。因此教师在日常教学中对文本进行难度分级,自行设计分级的教学用语料库,选择合适的语料抽取例句、发放学习材料、编制练习题目,就显得尤为重要。教师可以从大型语料库或自建语料库中进行检索,得到索引行后,将这些索引行保存到一个文件中,然后从这些索引行中抽样保存为一个单独的微型文本。在语料资源来源方面教师可以充分利用免费共享的在线语料库资源。目前网上常用的语料库有Bank of English,其拥有5.6亿词次的当代英国书面语和口语语料库(http://www.collins/co.uk/Corpus/CorpusSearch.aspx);British National Corpus,其拥有1亿词次的书面语和口语(http://corpus.byu.edu/bnc);Corpus of Contemporary American English,4亿词次的当代美国英语书面语语料库(http://wwww.americancorpus.org);Time Magazine Corpus,1亿词次的美国时代周刊的语料库(http://corpus.byu.edu/time/);virtual language Centre,其中包The Starr report,Brown,LOB,SCMP articles,Business