日蒙机器翻译及相关技术研究

被引量 : 3次 | 上传用户:guofy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文在借鉴以往机器翻译研究的理论和方法的基础上,充分利用日语和蒙古语在语法结构上极为接近的特征,研究实现了一套日蒙机器翻译系统。在系统资源方面,我们利用日本每日报2002年版,随机选择了农、林、牧、水相关报道800多篇建立了语料库,在此基础上编写了日蒙词干词典。在本文研究中,引用日语新语法即派生文法,研发了基于派生文法的日语句法分析器。为了提高日蒙机器翻译的性能,本文从以下几个方面着重进行了研究:(1)为了充分利用派生文法与蒙古语语法的相似特征,有必要把基于传统语法的日语词法分析器分析出来的结果重新分析,使其成为具有派生文法中所定义的附加成分形式。为此,研发了基于派生文法的附加成分分析器,实现了从基于传统语法词法分析到基于派生文法词法分析的转换。(2)提出了基于蒙古语语序的日语句节调序方法,解决了动词句节翻译中出现的语序错误问题。首先制定了调序规则,然后以此为据进行调序,为形成蒙古语句节自然顺序提供了有力保障。与此同时,采取了相应措施解决了同形附加成分的区分和サ变名词和サ变动词翻译难问题。(3)对日语功能词语义分析及其蒙古语翻译问题提出了一些看法,在一定范围内解决了功能词翻译难题。(4)制定句法分析规则,研发了基于派生文法的日语句法分析器。克服了日语句法分析器KNP在一个句节中出现开括号、闭括号、逗号、句号等对符号的处理、句节翻译以及整个句子的翻译带来的负面影响,并实现了日蒙句法分析及转换。我们在上述研究的基础上实现了日蒙机器翻译系统并进行了评测实验。以测试数据库的30个新闻报道作为对象,用本系统进行了翻译,对其生成的187个句子(评均词数为27.1个)进行了评价。正确翻译句子为150个,准确率达到了80.2%。在句法分析测试中,针对同语料库的310个新闻报道的1519个句子进行自动句法分析,其结果未出现出误。
其他文献
滨海相软土在珠三角、长三角、京津唐等沿海地区都是较为常见的,这种软土是一种具有高孔隙率、高含水量、高压缩性、低渗透性以及低强度等性质的粘土,其最具有代表性的有淤泥以
2011年底,我国正式发布旅游公共服务第一个五年规划——《中国旅游公共服务“十二五”专项规划》,旅游公共服务的建设成为一个重点课题。如何有效推进政府职能转变,构建完善的旅
Web应用具有用户数量庞大、使用环境复杂多变、更倾向于文件和信息的传递和获取等特点,传统的软件测试方法面临新的挑战。由于Web应用的多层体系结构,决定了在层与层之间可以使
<正>技术开发单位中国电子科技集团公司第23研究所技术简介毫米波及超宽带软波导技术以电磁学、机械学和材料学等学科的理论为基础,通过金属皱纹管成型和表面处理等工艺技术,
信用卡是一种先进的消费支付及信用工具,具有信用透支消费、转账结算、存取现金等基本功能。从1985年中国银行珠海分行发行我国第一张信用卡以来,我国的信用卡行业已走过20年发
<正>消毒供应中心是医院的重要部门,工作人员每天担负着全院各临床科室使用过的医疗器械、物品的回收、清洗、消毒灭菌任务,工作强度大,而且极易接触到被血液、体液污染的医
会议
<正>糖尿病性视网膜病变是我国50岁以上糖尿病患者的主要致盲原因,在西方则成为主要致盲病。我国糖尿病患者中糖尿病性视网膜病变的患病率达44%~51.3%。除长期高
随着我国经济水平的不断发展,企业管理制度也在逐步完善与改进。但是,由于市场变化以及企业自身因素等,导致企业经济信息管理始终存在一定的安全性问题,这些问题将会对企业发
学业自我是自我人格系统的重要组成部分,是促进学生有效学习和健康发展的重要因素。虽然学业自我是在学生个人的学习行为和心理历程中形成的,但是学生作为未完成的人,还需要
巴麦地区位于塔里木盆地的中西部,跨越巴楚断隆和麦盖提斜坡两个二级构造单元。目前在多层位、多类型圈闭中取得了油气的重大突破,特别是下古生界的突破,相继发现了巴什托、