论文部分内容阅读
近年来,计算机辅助翻译技术越来越普遍地得到应用。作为一种新兴技术,翻译语料库不光在计算机辅助翻译应用上具有广泛的前景,甚至对语言学、文体分析、翻译教学等领域都可产生新的发现与应用。试想,在一个语料收录量广阔而对应翻译精确的语料库中,对某一专业领域运用文本数据挖掘技术,我们将得到与该行业对应的特殊性词语关联规则,甚至此语料库中一些独特的语法搭配方式或书写习惯。在学生实践语料库中进行数据分析,可以建设一套数据驱动式的新型翻译教学方法。
一、外语教学语料库的建设
如今,很多公司、研究机构甚至高校都已经建设出了具有一定规模的语料库,大部分基础单词和例句已经分行业收录在这些语料库中。由于开发翻译语料库可以提高职业翻译的工作效率和翻译质量,为公司创造经济利益,所以目前语料库技术已经在很多翻译公司中得到了应用和发展。几十万条到上百万条不等的各语种语料库已经在各大翻译公司中建立了起来。这些语料除了从权威机构购买的基础词汇以外,一部分是公司内部员工翻译工作记录的积累,还有一部分来自因特网。这种语料来源致使语料库中存在一些不精确的翻译甚至少量翻译错误。目前,我国网络上还没有一个公开的、权威的中英翻译语料库,网上流传的资源大部分是一些词典类的网站自己搜索来的词法和例句,或者是一些外语爱好者上传的私人语料库。所以网络资源也并不可靠。语料库中的错误很容易诱导译员翻译错误,一个存在错误的语料库不适合用于高标准的翻译项目上。
高校教学中对语料库精确度的需要比其广度更高。一个精确的语料库才可以保证学生学习知识的权威性。所以教学用标准语料库中可以有些语料收录不全但是不能出现翻译错误,宁缺毋滥。平时学生作业可以用网络翻译语料库做为辅助,但是不能在文章中直接引用或作为权威翻译依据写入参考文献目录。教师进行笔译教学时更不可以直接引用网络语料库。
二、学生实践语料的应用——建设数据驱动的教学方法
高校学生在翻译学习和实践过程中,会产生大量的翻译语料。这些学生学习过程中积攒下来的语料存在很多翻译错误,同时也有一些正确甚至优秀的译文在同学们的译作中产生。掺杂错误的翻译语料库往往像鸡肋一样没有使用价值,想得到一个精确译文的语料库就必须要逐一检查出库中所有翻译错误并加以删除或改正,但是这么做需要耗费大量的人力和时间,得不偿失。
难道学生翻译实践语料资源就这么被费弃了么?不。任何数据积累到一定程度都有挖掘的价值。我们不妨逆向思维,既然不愿费力提取这部分语料中正确的翻译,何不尝试关注数据库中的翻译错误。其实高校教师教学的时候传道授业往往只需要用教科书中少量经典例句加以讲解,而后的主要时间是用来解惑。所以教学过程中更关注的是学生所犯的错误。翻译作业中每一篇文章都要经过全年级所有学生的练习,也就是说同一句话会产生出很多种译文版本。依靠计算机技术,我们很容易统计出每个单句的各种翻译版本在全年级学生作业中出现的频率。借此教师可以掌握现阶段学生的翻译水平,而且发现学生翻译中比较普遍或者典型的错误(出现频率高的错误)。对这样具有代表性的句子做课堂讨论给予着重讲解,使学生作业的信息得到及时反馈,增强学生的参与热情,达到一种数据驱动的教学模式。现代的翻译课程可以在联网的机房环境下进行,学生间共享资料很方便,教师也可以将学生译作中优秀的翻译例句及其出现的频率(即,有多少名同学可以独立做出类似的优秀翻译)公布给学生。从而激起学生的争胜心里,提高学生的独立思考能力,促进教学质量。
随着学生翻译作业语料库的积累,数据驱动的教学方法在教学法改革方面的作用也将凸显出来。教师发现重复率高的错误可以对其诱发原因进行深究,从而发现学生普遍的知识漏洞甚至教材或者教学内容中的不足。进一步探讨如何改进教学方法和教学内容,传授学生更好的翻译技巧以避免同类错误。对于比较经典的翻译习作可以作为保留作业逐年布置,教师一劳永逸地给译文作业做出细致的评判和注释,而后根据往届学生译作中语句出现频率的统计,利用加权评分的方法为各种有代表性的翻译版本打分。新的学生的翻译作业将进入系统自动对比,根据往届学生的翻译情况逐句给出翻译分数和老师的批注。学生可以根据统计数据得出自己每句翻译的相对水平和翻译错误,并通过学习老师的点评改正错误锻炼翻译技巧。如此利用语料库技术将大大提高教师的工作效率和教学效果,试想像这样全年级范围内的作业的点评纯靠教师手工完成将是无法想象的工作量。
语料库技术应用在翻译教学实践和教学成果评估等方面,可以增强学生的学习效果,同时极大地方便教学。当然教学特种语料库也不同于一般的应用翻译语料库,有其特殊的要求。在教学语料库具体建设实施以前,还应该对语料库结构属性的设定、译文与原文单双向对应、长短句和单词的划分规则等方面做进一步探讨。
一、外语教学语料库的建设
如今,很多公司、研究机构甚至高校都已经建设出了具有一定规模的语料库,大部分基础单词和例句已经分行业收录在这些语料库中。由于开发翻译语料库可以提高职业翻译的工作效率和翻译质量,为公司创造经济利益,所以目前语料库技术已经在很多翻译公司中得到了应用和发展。几十万条到上百万条不等的各语种语料库已经在各大翻译公司中建立了起来。这些语料除了从权威机构购买的基础词汇以外,一部分是公司内部员工翻译工作记录的积累,还有一部分来自因特网。这种语料来源致使语料库中存在一些不精确的翻译甚至少量翻译错误。目前,我国网络上还没有一个公开的、权威的中英翻译语料库,网上流传的资源大部分是一些词典类的网站自己搜索来的词法和例句,或者是一些外语爱好者上传的私人语料库。所以网络资源也并不可靠。语料库中的错误很容易诱导译员翻译错误,一个存在错误的语料库不适合用于高标准的翻译项目上。
高校教学中对语料库精确度的需要比其广度更高。一个精确的语料库才可以保证学生学习知识的权威性。所以教学用标准语料库中可以有些语料收录不全但是不能出现翻译错误,宁缺毋滥。平时学生作业可以用网络翻译语料库做为辅助,但是不能在文章中直接引用或作为权威翻译依据写入参考文献目录。教师进行笔译教学时更不可以直接引用网络语料库。
二、学生实践语料的应用——建设数据驱动的教学方法
高校学生在翻译学习和实践过程中,会产生大量的翻译语料。这些学生学习过程中积攒下来的语料存在很多翻译错误,同时也有一些正确甚至优秀的译文在同学们的译作中产生。掺杂错误的翻译语料库往往像鸡肋一样没有使用价值,想得到一个精确译文的语料库就必须要逐一检查出库中所有翻译错误并加以删除或改正,但是这么做需要耗费大量的人力和时间,得不偿失。
难道学生翻译实践语料资源就这么被费弃了么?不。任何数据积累到一定程度都有挖掘的价值。我们不妨逆向思维,既然不愿费力提取这部分语料中正确的翻译,何不尝试关注数据库中的翻译错误。其实高校教师教学的时候传道授业往往只需要用教科书中少量经典例句加以讲解,而后的主要时间是用来解惑。所以教学过程中更关注的是学生所犯的错误。翻译作业中每一篇文章都要经过全年级所有学生的练习,也就是说同一句话会产生出很多种译文版本。依靠计算机技术,我们很容易统计出每个单句的各种翻译版本在全年级学生作业中出现的频率。借此教师可以掌握现阶段学生的翻译水平,而且发现学生翻译中比较普遍或者典型的错误(出现频率高的错误)。对这样具有代表性的句子做课堂讨论给予着重讲解,使学生作业的信息得到及时反馈,增强学生的参与热情,达到一种数据驱动的教学模式。现代的翻译课程可以在联网的机房环境下进行,学生间共享资料很方便,教师也可以将学生译作中优秀的翻译例句及其出现的频率(即,有多少名同学可以独立做出类似的优秀翻译)公布给学生。从而激起学生的争胜心里,提高学生的独立思考能力,促进教学质量。
随着学生翻译作业语料库的积累,数据驱动的教学方法在教学法改革方面的作用也将凸显出来。教师发现重复率高的错误可以对其诱发原因进行深究,从而发现学生普遍的知识漏洞甚至教材或者教学内容中的不足。进一步探讨如何改进教学方法和教学内容,传授学生更好的翻译技巧以避免同类错误。对于比较经典的翻译习作可以作为保留作业逐年布置,教师一劳永逸地给译文作业做出细致的评判和注释,而后根据往届学生译作中语句出现频率的统计,利用加权评分的方法为各种有代表性的翻译版本打分。新的学生的翻译作业将进入系统自动对比,根据往届学生的翻译情况逐句给出翻译分数和老师的批注。学生可以根据统计数据得出自己每句翻译的相对水平和翻译错误,并通过学习老师的点评改正错误锻炼翻译技巧。如此利用语料库技术将大大提高教师的工作效率和教学效果,试想像这样全年级范围内的作业的点评纯靠教师手工完成将是无法想象的工作量。
语料库技术应用在翻译教学实践和教学成果评估等方面,可以增强学生的学习效果,同时极大地方便教学。当然教学特种语料库也不同于一般的应用翻译语料库,有其特殊的要求。在教学语料库具体建设实施以前,还应该对语料库结构属性的设定、译文与原文单双向对应、长短句和单词的划分规则等方面做进一步探讨。