论文部分内容阅读
汉语和日语都使用汉字,因此产生了大量的同形词。中日同形词是指中日两种语言中汉字字形相同的词语。其中,许多中日同形词在词义上产生了差异,本文将这类词称之为中日同形异义词。对于中国的日语学习者和日本的汉语学习者来讲,由于其各自的母语干涉,容易造成中日同形异义词的误用和误译。因此,中日同形异义词也成为了中日两国语言教学中的一个重要内容之一。先行研究中,从历史、文化、第二语言习得的角度来研究中日同形异义词的成果较多,但是从语料库语言学和机器翻译的角度来研究中日同形异义词的还不多见。另一方面,20世纪50年代以后,有关机器翻译的研究开始盛行起来。在同汉字圈的日语和汉语间的机器翻译中,有关日汉语言对比、机器翻译系统开发等方面的研究显得非常必要。目前,现有的免费网络翻译软件对中日同形异义词的误译依然存在。因此,从机器翻译的角度来研究中日同形异义词是十分必要的且具有一定价值。本论文对中日同形异义词进行研究,选取了日语ザ变动词「打破する」、「散発する」、「採取する」及其汉语同形词“打破”、“散发”、“采取”这三组词汇为具体研究对象进行考察。首先,在先行研究的基础上,从语料库语言学的角度,利用日语的『基于网络数据的ザ变动词数据库(开发版)』语料库以及汉语的『CCL语料库检索系统(网络版)』语料库抽取了大量的数据,对比分析了这三组中日同形异义词在义项、义项使用频度以及词语搭配方面的的异同点。其次,从机器翻译的角度,基于格语法理论,考察了「打破する」、「散発する」、「採取する」的搭配名词的语义属性及其各自出现频度最高的汉语译词,制作了其日中机器翻译规则。最后,从『京都大学格アレーム』语料库中抽取含有「打破する」、「散発する」、「採取する」的各自100个例句,共计300句作为翻译实验数据,结合一个试验性的日中机器翻译系统进行了翻译实验。翻译实验结果显示,用本研究制作的机器翻译规则得到了92%的平均正确率,与某网络免费翻译软件46%的平均正确率相比,表明了本研究翻译方法和翻译规则具有一定的有效性。笔者期待本研究成果能够为中日同形词的教学与研究提供有效的参考。同时,还期望能够为日中机器翻译提供一定的借鉴。今后将考察更多的词汇,为中日同形异义词的日中机器翻译提供更为详细的参考,以提高机器翻译译文质量。