论文部分内容阅读
随着科技和社会经济的快速发展,全世界的互联互通已经成为不可阻挡的发展趋势,首先便是正在不断深化的跨语言信息联通,我们正在以前所未有的速度从单语世界转向多语世界。小到出国旅游翻译或者技术资料翻译,大到基于互联网的在线电商、旅游、外贸活动、O2O、租车、金融等服务的国际化市场推广,一个无法避免的痛点在于面临多语种语言翻译问题。
机器翻译vs人工翻译
具体而言,翻译行业主要有传统翻译、机器翻译、在线人工翻译等众多模式。传统翻译在翻译行业的普遍问题就是关于速度、成本、便利性的问题,也就是人性化体验,其固有的传统机制已无法适应当今互联网时代潮流。而网民使用率和接受度最高的在线机器翻译,其翻译质量也饱受诟病,相信用过百度、Google、有道等在线翻译的朋友都能体会到,“请在一米线外等候”的英文翻译为“Please wait outside a noodle”、“平时禁止入内”翻译成“No entry on peacetime”,翻译质量如何,懂点语言知识的人一眼就能识出破绽,因而,质量问题永远是在线机器翻译的“硬伤”。
不过虽然翻译中存在一些错误,但这些错误却是在线产品不断改进的关键所在。由于机器学习技术能够自动检测结果,并作出相应的调整,使得这类服务可以随着使用量的加大不断改进。事实上,在线拼写检查功能正是通过这种方式才变成令人依赖的功能。
机器翻译是怎么实现的
机器翻译的研究是建立在语言学、数学和计算机科学这3门学科的基础之上的。语言学家提供适合于计算机进行加工的词典和语法规则,数学家把语言学家提供的材料形式化和代码化,计算机科学家给机器翻译提供软件手段和硬件设备,并进行程序设计。缺少上述任何一方面,机器翻译就不能实现,机器翻译效果的好坏,也完全取决于这三个方面的共同努力。
机译系统可划分为基于规则(Rule-Based )和基于语料库(Corpus-Based)两大类。前者由词典和规则库构成知识源;后者由经过划分并具有标注的语料库构成知识源,既不需要词典也不需要规则,以统计规律为主。基于规则的机译系统由词典和语法规则库构成翻译知识库,而基于语料库的机译系统是以语料的应用为核心,由经过划分并具有标注的语料库构成知识库,基于语料库的方法还可以分为基于统计(Statistics-based)的方法和基于实例(Example-based)的方法。
Google 的在线翻译已为人熟知,其背后的技术即为基于统计的机器翻译方法,基本运行原理是通过搜索大量的双语网页内容,将其作为语料库,然后由计算机自动选取最为常见的词与词的对应关系,最后给出翻译结果。基于统计的方法不需要依赖大量知识,直接靠统计结果进行歧义消解处理和译文选择,避开了语言理解的诸多难题。
机器翻译的贴心服务
实时语音翻译
微软旗下的语音通话服务Skype推出了英语与西班牙语之间的同声传译服务,而谷歌翻译现在可以为90种语言提供笔译,而且能够听译多种热门语言。在最新的版本中,这款应用还能自动识别某人说的是否一种热门语言,并自动将其转换成文本。只要携带安装该APP的手机,就可以在不同语言间进行自由交流,这种工具特别适合于普通大众出国旅游之用,真正实现“一机在手,走遍全球”。
微软在2014年5月的Code Conference上也演示了Skype实时翻译技术,微软副总裁帕尔通过Skype利用实时翻译技术与微软的另一位员工进行了对话,前者使用英语,后者使用德语,演示内容显示,Skype顺利完成了两者对话时的实时翻译。
翻译平台与其他平台结合
在2014年“双11”购物狂欢节,在阿里巴巴平台上,全球总共有217个国家和地区参与了这次抢购,跨境电商让“买卖遍全球”已经成为所有电商的共识。利用机器翻译技术解决买方、卖方以及电商平台提供方的跨语言沟通问题,eBay已经走在了前列,阿里巴巴也有自己的机器翻译研究团队,已经研制出了英语和俄语、英语和葡萄牙语之间的多套机器翻译系统。当将多国语言机器翻译云平台与基于互联网在线服务的人工客服系统连接在一起,就可以提供多语言智能自动翻译服务,帮助客服人员与国外客户进行友好交流。如果将翻译云平台与聊天平台相结合,就可以实现来自不同国家的朋友们进行基于文本/语音/视频的友好交流,可为社交平台、网游平台等提供语言沟通服务,据说微信也将提供汉英、汉德等21种语言间的机器翻译服务。
文言文也可以翻译了
当然,除了在不同语种之间的翻译之外,你有没有想过白话文和文言文之间的互翻呢?百度翻译就提供了相关的功能,百度翻译团队的相关负责人表示,这个定位的初衷就是从两个方面考虑——学习和娱乐。
翻译团队收集了大量文笔优美的古文进行机器训练学习,完成韵律模型。整个翻译原理就是结合收集的海量数据和机器翻译模型,在保证翻译结果基本正确的情况下,综合考虑古诗文的韵律、乐感、平仄声交错等规则,得出最后的翻译结果。团队还专门招聘了古代汉语文学专业的学生进行质量评估,对翻译提供建议和意见,帮助机器翻译优化。
触手可及的翻译应用
虽然翻译技术显得那么复杂和高大上,但是对于普通用户来说,常见的翻译不论是巨头如Google翻译、百度翻译、有道翻译、必应翻译,或是一些小而美的翻译应用,都足以满足需求了。
虽然机器翻译还无法达到人工翻译的准确性,也有大量的俚语俗语无法准确翻译,但是机器翻译以其快捷、便利以及强大的学习能力正变得越来越好,越来越实用。我们有充分的理由相信,在单语世界到多语世界的发展潮流中,机器翻译技术正在改变人们的工作和生活方式,要不了多久,机器翻译就会融入大家的日常生活中,成为生活不可缺少的一部分。
机器翻译vs人工翻译
具体而言,翻译行业主要有传统翻译、机器翻译、在线人工翻译等众多模式。传统翻译在翻译行业的普遍问题就是关于速度、成本、便利性的问题,也就是人性化体验,其固有的传统机制已无法适应当今互联网时代潮流。而网民使用率和接受度最高的在线机器翻译,其翻译质量也饱受诟病,相信用过百度、Google、有道等在线翻译的朋友都能体会到,“请在一米线外等候”的英文翻译为“Please wait outside a noodle”、“平时禁止入内”翻译成“No entry on peacetime”,翻译质量如何,懂点语言知识的人一眼就能识出破绽,因而,质量问题永远是在线机器翻译的“硬伤”。
不过虽然翻译中存在一些错误,但这些错误却是在线产品不断改进的关键所在。由于机器学习技术能够自动检测结果,并作出相应的调整,使得这类服务可以随着使用量的加大不断改进。事实上,在线拼写检查功能正是通过这种方式才变成令人依赖的功能。
机器翻译是怎么实现的
机器翻译的研究是建立在语言学、数学和计算机科学这3门学科的基础之上的。语言学家提供适合于计算机进行加工的词典和语法规则,数学家把语言学家提供的材料形式化和代码化,计算机科学家给机器翻译提供软件手段和硬件设备,并进行程序设计。缺少上述任何一方面,机器翻译就不能实现,机器翻译效果的好坏,也完全取决于这三个方面的共同努力。
机译系统可划分为基于规则(Rule-Based )和基于语料库(Corpus-Based)两大类。前者由词典和规则库构成知识源;后者由经过划分并具有标注的语料库构成知识源,既不需要词典也不需要规则,以统计规律为主。基于规则的机译系统由词典和语法规则库构成翻译知识库,而基于语料库的机译系统是以语料的应用为核心,由经过划分并具有标注的语料库构成知识库,基于语料库的方法还可以分为基于统计(Statistics-based)的方法和基于实例(Example-based)的方法。
Google 的在线翻译已为人熟知,其背后的技术即为基于统计的机器翻译方法,基本运行原理是通过搜索大量的双语网页内容,将其作为语料库,然后由计算机自动选取最为常见的词与词的对应关系,最后给出翻译结果。基于统计的方法不需要依赖大量知识,直接靠统计结果进行歧义消解处理和译文选择,避开了语言理解的诸多难题。
机器翻译的贴心服务
实时语音翻译
微软旗下的语音通话服务Skype推出了英语与西班牙语之间的同声传译服务,而谷歌翻译现在可以为90种语言提供笔译,而且能够听译多种热门语言。在最新的版本中,这款应用还能自动识别某人说的是否一种热门语言,并自动将其转换成文本。只要携带安装该APP的手机,就可以在不同语言间进行自由交流,这种工具特别适合于普通大众出国旅游之用,真正实现“一机在手,走遍全球”。
微软在2014年5月的Code Conference上也演示了Skype实时翻译技术,微软副总裁帕尔通过Skype利用实时翻译技术与微软的另一位员工进行了对话,前者使用英语,后者使用德语,演示内容显示,Skype顺利完成了两者对话时的实时翻译。
翻译平台与其他平台结合
在2014年“双11”购物狂欢节,在阿里巴巴平台上,全球总共有217个国家和地区参与了这次抢购,跨境电商让“买卖遍全球”已经成为所有电商的共识。利用机器翻译技术解决买方、卖方以及电商平台提供方的跨语言沟通问题,eBay已经走在了前列,阿里巴巴也有自己的机器翻译研究团队,已经研制出了英语和俄语、英语和葡萄牙语之间的多套机器翻译系统。当将多国语言机器翻译云平台与基于互联网在线服务的人工客服系统连接在一起,就可以提供多语言智能自动翻译服务,帮助客服人员与国外客户进行友好交流。如果将翻译云平台与聊天平台相结合,就可以实现来自不同国家的朋友们进行基于文本/语音/视频的友好交流,可为社交平台、网游平台等提供语言沟通服务,据说微信也将提供汉英、汉德等21种语言间的机器翻译服务。
文言文也可以翻译了
当然,除了在不同语种之间的翻译之外,你有没有想过白话文和文言文之间的互翻呢?百度翻译就提供了相关的功能,百度翻译团队的相关负责人表示,这个定位的初衷就是从两个方面考虑——学习和娱乐。
翻译团队收集了大量文笔优美的古文进行机器训练学习,完成韵律模型。整个翻译原理就是结合收集的海量数据和机器翻译模型,在保证翻译结果基本正确的情况下,综合考虑古诗文的韵律、乐感、平仄声交错等规则,得出最后的翻译结果。团队还专门招聘了古代汉语文学专业的学生进行质量评估,对翻译提供建议和意见,帮助机器翻译优化。
触手可及的翻译应用
虽然翻译技术显得那么复杂和高大上,但是对于普通用户来说,常见的翻译不论是巨头如Google翻译、百度翻译、有道翻译、必应翻译,或是一些小而美的翻译应用,都足以满足需求了。
虽然机器翻译还无法达到人工翻译的准确性,也有大量的俚语俗语无法准确翻译,但是机器翻译以其快捷、便利以及强大的学习能力正变得越来越好,越来越实用。我们有充分的理由相信,在单语世界到多语世界的发展潮流中,机器翻译技术正在改变人们的工作和生活方式,要不了多久,机器翻译就会融入大家的日常生活中,成为生活不可缺少的一部分。