基于语料库的中日同形词词义用法对比及其日中机器翻译研究

来源 :广西大学 | 被引量 : 0次 | 上传用户:huangzhongyan22
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
汉语和日语都使用汉字,因此产生了大量的同形词。中日同形词是指中日两种语言中汉字字形相同的词语。其中,许多中日同形词在词义上产生了差异,本文将这类词称之为中日同形异义词。对于中国的日语学习者和日本的汉语学习者来讲,由于其各自的母语干涉,容易造成中日同形异义词的误用和误译。因此,中日同形异义词也成为了中日两国语言教学中的一个重要内容之一。先行研究中,从历史、文化、第二语言习得的角度来研究中日同形异义词的成果较多,但是从语料库语言学和机器翻译的角度来研究中日同形异义词的还不多见。另一方面,20世纪50年代以后,有关机器翻译的研究开始盛行起来。在同汉字圈的日语和汉语间的机器翻译中,有关日汉语言对比、机器翻译系统开发等方面的研究显得非常必要。目前,现有的免费网络翻译软件对中日同形异义词的误译依然存在。因此,从机器翻译的角度来研究中日同形异义词是十分必要的且具有一定价值。本论文对中日同形异义词进行研究,选取了日语ザ变动词「打破する」、「散発する」、「採取する」及其汉语同形词“打破”、“散发”、“采取”这三组词汇为具体研究对象进行考察。首先,在先行研究的基础上,从语料库语言学的角度,利用日语的『基于网络数据的ザ变动词数据库(开发版)』语料库以及汉语的『CCL语料库检索系统(网络版)』语料库抽取了大量的数据,对比分析了这三组中日同形异义词在义项、义项使用频度以及词语搭配方面的的异同点。其次,从机器翻译的角度,基于格语法理论,考察了「打破する」、「散発する」、「採取する」的搭配名词的语义属性及其各自出现频度最高的汉语译词,制作了其日中机器翻译规则。最后,从『京都大学格アレーム』语料库中抽取含有「打破する」、「散発する」、「採取する」的各自100个例句,共计300句作为翻译实验数据,结合一个试验性的日中机器翻译系统进行了翻译实验。翻译实验结果显示,用本研究制作的机器翻译规则得到了92%的平均正确率,与某网络免费翻译软件46%的平均正确率相比,表明了本研究翻译方法和翻译规则具有一定的有效性。笔者期待本研究成果能够为中日同形词的教学与研究提供有效的参考。同时,还期望能够为日中机器翻译提供一定的借鉴。今后将考察更多的词汇,为中日同形异义词的日中机器翻译提供更为详细的参考,以提高机器翻译译文质量。
其他文献
蒲长城副局长就浙江省质监局能源计量工作作出重要批示:“浙江省质监局通过推进区域(行业)节能减排工程,形成体现特色的能效标准体系、能源计量检测分析体系,实现二降低(能耗、物耗
目的:探讨保留乳头、乳晕乳腺癌术后即刻硅胶假体植入的适应症及临床效果。方法:收集2011年2月至2014年3月大连医科大学附属第一医院乳腺外科25例乳腺癌患者作为观察组,该组病例
本文以2009-2018年沪深A股上市公司为样本,探讨控股股东股权质押对高送转、公司股价崩盘风险的影响。实证分析发现:控股股东进行股权质押后,会显著增加上市公司未来的股价崩
本文以上市公司年报窗口期的累计异常换手率作为内幕交易的衡量指标,并根据A股公司2010-2017年数据考察了内幕交易对公司投资效率的影响。实证结果表明,内幕交易会抑制外部投
本文章通过对山东烟台万华聚氨酯股份有限公司工程场地的初详勘砂土液化判定,对比了SPT法和CPT法对液化判定的优缺点。针对场地特点,与工程实际相结合,采用更加科学可靠和经
土地利用总体规划是在一定区域内.根据国家社会经济可持续发展的要求和当地自然、经济、社会条件.对土地的开发、利用、治理、保护在空间上、时间上所作的总体安排和布局.是国家
行政复议是监督行政机关依法行使职权和维护公民、法人,以及其他组织合法权益的一项重要法律制度。近年来,随着我国立法的逐步完善、普法工作的深入开展和执法力度的不断加大,土
本文运用2008—2018年我国105家商业银行数据,考察了信贷约束与商业银行从事非标债权资产投资业务的关系及其经济效应。研究发现:其一,信贷约束显著促进了银行从事非标债权资
教科书是课程目标的体现者,其改编与修订,是课程改革的主要内容之一。高中生物教科书内容的现代化是课程发展变化的重要方面。对高中生物教科书内容现代化的变迁进行研究,有
我国进入21世纪之后,国民经济得到了长足发展,也促进了建筑科技的不断进步和发展,使房屋建筑工程的施工水平也有了很大提高。混凝土是现代工程建筑中常用的建筑材料,混凝土构