一个英汉机器翻译系统的研究与实现

被引量 : 0次 | 上传用户:LoveYouNeverChange
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着国际间的交流与合作不断扩大和深入,语言差异成为交流与合作的最大障碍。机器翻译作为突破语言障碍的重要技术手段,人们对它有强烈的需求。然而,由于自然语言的复杂性,机器翻译到现在仍然是非常困难的。机器翻译经过50 年的探索实践,研究人员逐渐认识到,单纯使用一种方法难以处理自然语言中各种复杂现象。现在的机器翻译系统(MTS)的实现越来越多地集成了不同的方法和策略,至少在不同的阶段采用不同的方法。本文提出一个基于规则的英汉机器翻译系统设计方案,系统由翻译引擎和机器字典两部分组成。在翻译的控制策略上,采用多层次的处理方法。针对语言中不同层次的歧义现象,把机器翻译过程划分为预处理、词法分析、词类消歧、短语分析、小句分析和译文选择六个层次,每个层次使用不同的方法和策略。句法分析不生成完整的语法树,而是生成句子的单词和短语序列,句子被看作是小句的递归,小句作为基本翻译转换单位通过句型匹配来实现转换。在系统的知识体系上,将语言共性的、过程性的知识体现在程序的算法中,而将语言个性的、叙述型的和控制型的知识针对单词组织存放在机器字典中。在字典的每个词条下面,除了包括语法、语义、搭配知识外,还包括用规则或条件表示的词类消歧、结构消歧和译文选择等知识。这种知识的组织表示方式,能够较好的解决不同知识粒度的表示,避免了规则之间的冲突。系统是在windows 环境下用Visual C++开发和调试的。初步试验的结果是令人满意的。本文组织如下:第一章为前言,介绍机器翻译的概念、发展历史、基本过程和研究方法,描述了论文研究背景及其意义,最后概括了本文的主要工作;
其他文献
贲门腺癌(Gastric cardia adenocarcinoma,GCA) 是我国北方特别是河南林州地区最常见的恶性肿瘤之一。GCA的显著流行病学特征是其与食管癌地域性分布的一致性,并且目前仍然是
本人将从大提琴的演奏发展入手,介绍一些现代艺术家对于大提琴演奏的尝试和探索。在现代大提琴演奏技法方面,将举几个典型的谱例来进行说明。如潘德雷斯基(siegried penderec
在铁路运输中,制动对确保行车安全是至关重要的,列车制动是靠压缩的流动空气作为制动动力源的,在平原正常大气压下利用压缩空气与外界大气压的压差经过反复的验证制定出了制
旅游业的迅猛发展,对推动国民经济起到了举足轻重的作用,国家各有关部门也对旅游业给予了高度重视,将旅游业列为了国民经济发展新的增长点。然而,当前紊乱的旅游市场秩序阻碍
网上证券交易是投资者利用因特网取得证券经纪商提供的委托下单服务、证券即时报价以及投资咨询服务实现实时证券交易的新型证券业务委托手段。因其相对于传统委托手段具有不
面对新世纪更加激烈的国际竞争和加入WTO的挑战,中国石油工业面临着严峻的考验。以壳牌、埃克森等几家跨国公司为代表的国际石油公司已进入中国的油气开发市场。我国的原油价
<正>《越策越开心》是湖南经视2002年5月开播的一档娱乐性脱口秀节目,开播以来已连续五年雄踞湖南本土电视收视率之冠,连年获得全国电视百佳及全国电视节目评比综艺类一等奖
可变发射率材料(variable emissivity material)是一种新一代自适应智能型材料,能调控物体的红外辐射特性,在红外隐身/伪装、热控制、节能等军事和民用领域具有潜在的应用背景
作为中意深化文化交流合作的重点项目,由四川省文物局组织策划的以古蜀文明及四川汉代精品文物为主题的“三星堆:神与人的世界——四川古代文明展”目前正在罗马市图拉真市场
报纸
二十世纪八十年代以来,教学反思受到越来越多教育界研究者的关注,成为国内外的研究热点之一。由于教学反思是提高教师综合素质和促进教师专业发展的重要途径之一,因此更多的