【摘 要】
:
在当今世界,随着信息的急剧增加,国际交流的日趋频繁,机器翻译的潜在需求越来越大。机器翻译方法按照其使用理论不同可以分为基于规则的、基于语料库的和混合翻译方法三种。
论文部分内容阅读
在当今世界,随着信息的急剧增加,国际交流的日趋频繁,机器翻译的潜在需求越来越大。机器翻译方法按照其使用理论不同可以分为基于规则的、基于语料库的和混合翻译方法三种。不同的机器翻译方法有各自的优点和局限性。基于规则的方法可以很准确的描述语言特征规律,但是它很难覆盖所有的语言现象;基于实例的方法译文质量非常高,但是命中率非常低,对语料库的要求也非常严格;统计翻译方法可以缓解知识获取的瓶颈问题,但是它所采用的N元语法模型无法解决长距离依存问题,并且还存在着语料库标注体系不完善、语料库数据稀疏等问题。因此不管采用哪种翻译方法,总是不能取得理想的效果。所以基于混合策略的机器翻译方法成为当今机器翻译研究的焦点,从而可以避免每种翻译方法的不足,达到翻译结果的最优化。由于蒙古语属于黏着语,它的构词和构形都是以词根、词干上连接不同的词缀来完成的,从句子的基本语序看,属于SOV(主宾谓)型语言。单从译文方面来分析,词形变化方面的错误以及句子语序混乱问题比较明显和突出。因此,本文专门针对蒙古语的特点,利用开源的基于短语的统计机器翻译的Moses解码器,在此基础上加入trigger对长距离蒙古语语言模型以及汉蒙调序模型两个特征,最后实验结果表明,翻译结果是合理的,相对于Moses对比系统来说,翻译性能有了明显提高。
其他文献
近年来,作为软件应用的一种重要方式,web服务发展迅速,许多web服务提供相同的功能。服务组合的含义就是把多个小粒度服务组合为一个大粒度服务,它是用户利用多种多样的web服
随着大数据时代的到来,用户对信息搜索的精确度和效率提出了更高要求,而传统的搜索引擎存在着一定的不足。聚类检索是对搜索引擎的返回结果聚类,然后将提取的标签和类簇呈现
随着互联网和信息技术的不断发展,文本形式的非结构化数据正在不断的增加。文本分类技术能够有效地对文本数据进行组织和处理,广泛地应用在各个领域。文本分类的预处理、特征
并行测试技术是ATS (Auto Test System)在进一步降低测试的时间、削减测试的成本的趋势下新兴的一项技术,它正以不可比拟的优势成为下一代ATS发展的热点。在运用并行测试技术
随着三维模型的大量产生,三维模型检索技术逐渐受到学者们的广泛关注。其中比较主要的检索方法是基于内容的三维模型检索,而基于内容的检索技术的核心是特征提取。本文在借鉴
随着数字技术的发展,数字图像与视频在工业自动化、影视后期制作等领域,逐渐得到了广泛的应用。图像和视频的编辑与合成是图像和视频处理的一项重要技术,而传统的图像和视频的编
Mashup是目前网络上流行的一个词语,它起源于对流行音乐的描述,指的是从两首不同的歌曲(通常属于不同的流派)中混合演唱和乐器的音轨而构成的一首新歌。类似的,Mashup也是内
硬件验证技术已经成为硬件电路设计中的瓶颈,验证在整个产品开发流程中占据的人力资源与时间资源愈加庞大,但验证的效率和可重用性却非常低。因此在产品上市之前,提供高效率
伴随着网络与通信的发展,物联网、云计算、大数据等一批新兴的网络应用将会彻底改变人们的思维方式,从而促进社会文明与科技的进步。虽然技术的发展给社会带来了福利,但是我
工作流技术是目前工程项目管理领域的研究热点,它被广泛应用于企业业务过程建模、仿真分析、优化和集成等领域,是实现企业业务流程自动执行的重要技术。工作流技术的应用研究