基于Internet的人机互助机器翻译技术的研究

被引量 : 5次 | 上传用户:shuishui06
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着国际交流日益增多,在计算机、互联网等相关技术日新月异的基础上,机器翻译的技术与应用也取得了蓬勃发展。机器翻译是用计算机来实现不同语言之间的翻译,分为基于规则的机器翻译方法和基于语料库的机器翻译方法。另有,基于混合式的机器翻译方法非常胜行,即:两种方法的结合。如,在基于规则的技术中引入了语料库方法,其中有基于实例的方法、统计方法,通过对语料库的预处理使其转化为自然语言知识库的方法。近年来,基于语料库的机器翻译技术发展较快,得到了广泛的应用,根据不同领域和市场的需求,出现了各色各样有一定实用价值的机器翻译产品,使机器翻译技术真正走向了科技发展的征途。本文提出的基于Internet的人机互助机器翻译方法是一种新的辅助翻译的方法,该方法异于以往的机器翻译方法,它不完全依赖于机器的自动学习,而是通过网络爬虫技术从Internet上获取双语平行语料,然后在人工的干预下完成整个翻译过程,相比于独立的机器自动翻译,翻译质量更佳,相比于独立的人工翻译,翻译效率更高。对翻译技术的探究过程中,主要做了以下工作:(1)基于语料库的机器翻译方法可分为两种:基于统计的机器翻译方法和基于实例的机器翻译方法,它们都采用语料库作为翻译知识的来源。本文采用基于统计的机器翻译方法。双语平行语料库是通过网络爬虫技术从Internet获取。(2)获取语料库后,考虑到语言的复杂性,目前全自动的机器翻译方法还未能完全达到令人满意的效果,因此,该论文提出了对译文进行了人工干预的计算机辅助翻译方法,其采用基于人工打分的译文权重方法使翻译结果达到最优。(3)在统计机器翻译的过程中,对参数训练中得到的短语表进行有效过滤,使得短语表更加合理。(4)目前主要采用的是N元语法模型,本文使用的是tri-gram语法模型,该模型构建简单、直接,但同时也因为数据缺乏采取了平滑技术对其进行平滑。(5)最后,本文加入人工评分与C-value方法,对翻译模型进行改进。实验表明,改进后的机器翻译方法优于传统的机器翻译方法,短语翻译概率表缩减了至少10%,BLEU值也有了一定的提高。
其他文献
村委会换届选举中的贿选行为,严重损害了群众的民主权利,破坏了换届选举的正常秩序,干扰了农村基层民主政治建设的健康发展,影响了农村经济发展和社会稳定。本文以L市为例,通
由于我国社会主义市场经济的不断快速发展,对于供应链的库存研究也日趋成熟,越来越多的人开始注重企业的供应链仓库管理。供应链在管理过程中可以为其在正常的经营活动下使得
提出了一种基于分形布朗运动的音频特征提取和识别方法 这种方法使用分形布朗运动模型计算出音频例子的分形维数 ,并作为其分形特征 针对音频分形特征符合高斯分布的特点 ,
女性文学是中国古代文学的重要组成部分,历来都受到很多研究者的关注。宋代女性文学更是中国古代女性文学的一座高峰,尤其是宋代女词人的研究颇受研究者的重视。但是对于宋代
随着经济全球化的不断推进、网络和计算机技术的快速发展,电子商务作为一种全新的商业模式,因为其跨越时空限制、方便快捷等优点,已经在全球范围内得到了广泛的应用。但电子
戴维·赫伯特·劳伦斯(1885--1930)是20世纪英国文学史上最具争议的作家之一,但同时也是世界文坛上最重要的人物之一。作为劳伦斯的最后一部长篇小说,《查泰莱夫人的情人》使
编辑学作为一门原创性、综合性极强的基本学科,可以说是和中国文化传播事业的发展休戚相关:从1949年李次民教授首先确立了"编辑学"这一科学术语开始,编辑学跟着经历了五六十
随着电子计算机信息技术和网络技术的飞速发展,作为传统证券交易所主要标志的证券交易所营业大厅失去了实际意义,旧的会员制证券交易所的管理模式已经不能适应时代的需要,严
本文首先对中间产品进口促进经济增长的机理进行了分析,在此基础上,采用计量经济学方法对中间产品进口与经济增长关系进行检验,发现中间产品进口与经济增长之间存在显著的单
《关于实施中华优秀传统文化传承发展工程的意见》对于我们努力建设社会主义文化强国,实现中华民族伟大复兴的中国梦,不仅具有十分重要的实践意义,而且其提出的许多命题本身,