【摘 要】
:
统计机器翻译使用统计方法自动地把一种自然语言的文本转换成另一种自然语言的文本。最近,统计机器翻译研究者开始关注融合语言学信息的翻译模型。在这些模型中,基于树到串对
论文部分内容阅读
统计机器翻译使用统计方法自动地把一种自然语言的文本转换成另一种自然语言的文本。最近,统计机器翻译研究者开始关注融合语言学信息的翻译模型。在这些模型中,基于树到串对齐模板的翻译模型是一种很好的代表。首先,本文对受句法指导的树到串对齐模板模型进行了较为全面的论述,并实现了基于树到串对齐模板模型的解码器。详细讨论了树到串对齐模板模型的形式化定义、参数估计和解码方法。同时,为了加速树到串对齐模板模型的解码速度,使用了立方体剪枝策略。其次,对树到串对齐模板模型进行了实证分析。将树到串对齐模板模型和短语模型在三个方面上进行了详细地对比。第一,树到串对齐模板模型的生成能力更强,能够表达语言中常见的非连续搭配问题。第二,树到串对齐模板模型在处理长距离调序问题上比短语模型更有优势。第三,树到串对齐模板模型不能表达非句法连续短语。最后,使用Moses做为对比系统在NIST-2005和NIST-2008 MT测试集上对解码器进行了实验验证。最后,对基于统计方法的音译汉英外国人名进行了探索。第一,讨论了常见的统计音译方法分类,详细介绍了基于序列化标注模型和基于噪声信道模型的两种音译模型。第二,通过充分的实验比较得出结论:对基于噪声信道方法的音译模型而言,汉语应该以汉字为基本单位,通过音节化英文人名能够在低阶语言模型上获得更好的翻译性能。第三,通过重排序的方法可以极大地提升模型的性能。
其他文献
汉字输入技术随着自然语言处理研究的进展而不断进步,其对应的输入法系统也不断地涌现。这些系统在满足一般性需求上已经取得了较好的成绩,但用户在转换准确率和转换速度仍有更
所谓复述,就是对相同语义的不同表达方式,是自然语言中比较普遍的一个现象,它集中反映了语言的灵活性和多样性。近年来,自然语言处理各种底层技术的不断发展和成熟,为复述研
纹理可以描述很多自然现象,在图形学真实感绘制中,纹理映射可以极大地增强绘制真实感。随着影视、游戏特效真实感要求的日益提高,单幅样图纹理信息已不能满足需求。多样图混
随着移动通信技术的进步和智能手机操作系统的发展,手机电视应运而生,而其所带来的无所不在、无时不在的视听享受倍受用户青睐。内容提供商、网络运营商、终端设备提供商纷纷
图像质量评价标准在图像和视频编码里是一个非常重要的课题,它不仅是衡量图像视频压缩算法效果的指标,而且是编码率失真优化的准则。而由于基于主观感知的图像质量评价标准对
本文主要研究了以太网环境下的数据链路层拓扑发现问题。在目前的研究中,大多数拓扑发现是基于使用SNMP协议查询以太网交换机的拓扑相关信息。然而,使用SNMP协议存在着一些问
交叉路口是城市交通的瓶颈之一,减少车辆在这些节点上的等待时间可以有效提高交通系统的效率。本文首先介绍了最新提出的基于预留技术的Multiagent交叉口车辆控制系统(Reserv
随着信息时代的到来,网络在人们生活中的重要性越来越大。而不管网络中各种技术怎样革新,人们都需要从海量数据里面找到自己所需要的信息。由此可见无论技术怎样进步,搜索引
如何从物体的二维图像中恢复三维结构,即三维重构,是计算机视觉技术研究领域中的重要问题。而其中的单幅未标定图像的三维重构问题更是近十年来的研究热点,被广泛应用于虚拟
随着计算机网络技术的发展与应用,网络协议日益复杂,协议开发过程中任何一点错误都将给分布式系统的稳定性、可靠性、坚固性、安全性、容错性以及异种系统之间的互通性带来巨