论文部分内容阅读
本文对面向中文专著的汉韩机器辅助翻译进行了研究。主要成果可以归结为以下六个方面:
第一,深入地分析了中文专著的语言特点。中文专著在编写格式、语言运用上除了一般文章的共性外,有着它们特殊的个性和规律。本文通过对中文专著的定量、定性分析,揭示了其中的一些规律性内容。这些语言特点直接为汉韩机器辅助翻译系统的设计提供了切实的依据。
第二,本文在对比语言学理论指导下,系统地考察了汉韩两种语言在词汇、句子层面上的异同点。本文的语言对比研究直接服务于中文专著的韩文翻译。以往的汉韩对比研究主要针对文学作品的翻译,而对学术性文章的翻译问题并没有给予足够重视。本文针对中文专著的韩文翻译,加强了这种受限领域的语言对比研究。另一方面,这些研究对机器辅助翻译有着更直接的指导意义。本文尽量利用汉语与韩国语在语言形式上的共同点,重新调整适合处理汉韩两种语言的翻译系统。同时对语言形式上的不对应现象加以关注,并且找出一些规律性的办法来解决实际问题。
第三,在专著语言特点分析以及汉韩语言对比的基础上,参照原有的汉英机器辅助翻译模型,分析其中存在的问题,本文提出了一种改进的汉韩机器辅助翻译模型。该模型的特点可以概括为:采取支持Unicode编码方式的系统设计;提高术语辅助翻译工具的自动化水平;提高翻译记忆系统的利用率,从而实现以小句为转换单位的翻译记忆系统。
第四,提出了面向专著的汉语术语自动提取与韩国语辅助翻译方法。任何专著都有其特定的术语,相应地,专著翻译任务中必然涉及专业术语的翻译。为此,本文提出了计算机辅助的术语翻译方法。当设计术语辅助翻译模型时,主要考虑的是“专业术语的自动提取”和“汉语术语的韩国语翻译”这两个方面。关于中文术语的提取方面,本文工作则采取了“以统计方法为主,规则方法为辅”的策略。结果表明,统计和规则相结合的方法大幅度提高了术语提取的准确率。此外,本文提出了汉语术语的韩国语辅助翻译方法。在术语辅助翻译过程中,术语知识库的规模和质量是翻译系统成败的关键,为弥补汉韩对照术语资源的不足,本文充分利用已有的英汉、英韩术语资源,以英语作为桥梁,构建汉韩对照术语表。在此基础上,使用汉韩双语词典、术语转换模板以及韩国语语料库进行中文术语的韩文辅助翻译。
第五,本文提出了面向中文专著的汉韩翻译记忆模型。翻译记忆(TranslationMemory)的基本思想是帮助译者处理重复出现的语言现象。为实现高效率的翻译记忆模块,本文提出了小句一级的处理方法。由于句子一级的语句匹配成功率不高,本文尝试把复杂长句切分成几个简单短语或小旬,从而提高翻译记忆系统的效率。另外,又将短语一级的翻译模板用于中文专著的韩文翻译工作。为建设翻译模板库,本文使用串频统计方法自动提取重复出现的短语。实验结果分析表明,中文专著语句虽然在句子一级的重复率不高,但是在小句或短语的重复率相当高,因此,这种方法对中文专著的翻译提供了有力的帮助。
第六,本文以中文专著《现代汉语语法信息词典详解》为例,专门考察了汉语的隐喻现象和韩国语翻译问题。结果表明学术性语言中也有不少的隐喻现象,包括词汇级隐喻和语句级隐喻。从语言对比的角度看,汉韩两种语言中的隐喻表达方式不仅相同。对此,本文一面进行了详细描述,一面提出了一个隐喻翻译的策略。