论文部分内容阅读
随着信息时代的发展,国际互联网的迅速普及,作为信息主要载体的语言文字间的翻译需求空前迫切,机器翻译和自然语言理解的潜在需求越来越大,其研究越来越受到人们的重视,它的研究成果有着重要的社会效益和经济效益。 机器翻译涉及语言学、计算数学、计算机技术、人工智能等多种学科和技术领域,研究难度大,技术难题多,目前的研究已经日趋深入,正在探讨句法分析与语义、语境分析结合,或建立语义、语境分析体系等,以实现更好的翻译质量。 本文的研究工作是受基于实例的机器翻译的启发。在研究英汉对译词语的基础上,建立了英汉对译词语库,并进一步探索了英汉对译词语在句中所起的作用。 对译词语是指一个源语言的语言成分只能译为一个目标语言的语言成分,该目标语言的语言成分亦只能回译为同一个源语言的语言成分,即在两个语种中可以进行唯一互译的词语我们称为对译词语。本文研究英汉对译词语包括词与词的对译,词组与词组的对译和术语与术语之间的对译三个部分,术语的对译以IT技术领域的术语为例。 笔者提出了对译词语的概念,并界定了几种不同的对译词语,又以多种不同的工具书和语料作为基础,首次研究英汉词语的对译情况,并对英汉对译词语作了定量一定性分析。获得了以下几个方面探索性的成果。 (1)在UCDOS系统抽取出的英汉词表40,308条中找出名词、形容词和动词三类词性的词语,再参照《金山词霸》、《大英汉词典》、《汉英词典》,分别得到三类词性的对译词4405、847和169条。 (2)从英汉单义项词表和《最新美国科普短文》并参照《金山词霸》和《汉英词典》校正,得到汉英单向单义词语1106条。 (3)从人民日报1998年7月的语料189,185字中人工标记出较为常用的固定词组,再与《汉英汉法报刊用语词典》进行参照,得到英汉对译词组602条。 (4)从《计算机科学技术百科全书》和《微电脑世界》1999年第二期的语料164,490字中找出IT领域对译术语1693条,其中1136条来自辞书,557条 北京语言文化大学硕士学位论文来自语料。 (5)笔者在中文信息技术领域的《微电脑世界》语料99,615字p343句冲,考察了普通对译词语出现情况。普通对译词语出现3729词次,占总语料字数6.74胄 其中二字词的对译词出现的比率最高,占对译词汉字数84.15气占总语料5.68% (6)笔者在中文信息技术领域的《微电脑世界》语料 99,615字C343句)中,考察了上述IT领域的对译术语出现情况。对译术语在语料中出现的字数为13010字,约占语料总字数的13%:有对译术语出现的句子1682句,约占总句数的71%。这一结果使我们对于对译词语的研究和应用的信,乙大大增加。 本文还探讨了英汉对译词语和对译术语在多义选一和模糊成分清晰化中的驱动作用。 由于时间的原因,本人十分遗憾未能进一步扩大探索英汉对译词语在大规模真实文本处理中所起的作用,今后希望能更深人探讨对译词语在机器翻译系统中的重要作用,看看是否能从另一个角度提供新的突破口。