论文部分内容阅读
机器翻译作为当前最热门的人工智能产品之一,是语言与人工智能结合的产物。当前,机器翻译将神经网络技术与翻译结合,以句子为单位进行建模,在理论上能够识别语境意义或搭配意义,大大提高了机器翻译的准确率。但在翻译人文类文本时,因缺乏词义层面基于语境的准确编译,使得人文类文本翻译的准确率远低于技术文本的翻译准确率。鉴于此,本研究基于兰盖克提出的识解理论,聚焦机器翻译与人工翻译在识解方式上的差异,尝试回答以下问题:(1)机器翻译与人工翻译在识解维度上是否有差异?如果有,这些差异是什么?(2)这些差异在识解维度上是如何分布的?有何特征?进而探究造成这些差异的可能的原因,对未来机器翻译的发展优化提出建议。研究语料是以国内某高校非英语专业大一年级期末考试中译英翻译试题作为原文,以学生的答案作为人工翻译的分析文本,以三种机器翻译软件直接生成的译文作为机器翻译的分析文本。本研究同时采用了定量分析和定性分析的方法。定量分析法应用于统计人工译文中不同表达方式的出现频次,出现最频繁的对同一原文的三种不同译文表达代表人工译文的普遍性。定性分析法应用于案例分析,对比机器翻译与人工翻译在识解维度上的差异。研究分析共包含25个对比案例,体现差异31处:其中体现突显差异的14处,视角差异6处,详略度差异8处,背景和辖域差异3处。通过对比分析发现:(1)突显维度分析显示,机器翻译系统以词或词组为单位对原文进行句子成分分析,可能会导致突显意义搭配不当;(2)视角维度分析显示,机器翻译已建立完成体的触发标记,但是缺少平行结构触发标记;人工翻译能准确识解平行结构,但是对汉语完成体的识解尚未形成统一标准;(3)详细度分析显示,机器翻译系统能根据译文进行损译。但在大多数情况下尽可能遵守对译原则,不增译,不损译。(4)背景和辖域维度分析显示,机器翻译更偏好中性词,规避打破原有背景辖域的风险。根据以上研究发现,研究者从语言学角度出发,对机器翻译程序设计提出4点建议(1)在以句子为单位建模的基础上,以语块为单位而不是单字或单一词组进行编码和解码,考虑搭配意义和语境意义;(2)设置平行结构触发标记,提高译文的语篇衔接程度;(3)建立独有文化概念的双语或多语平行语料库,为机器译文的增译现象提供语料支持;(4)标记语料库中词语的褒贬性。