关于层次短语翻译模型调序问题的研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:gomo08
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本论文旨在研究统计机器翻译中的调序问题。特别地,我们选择了对基于层次短语的统计机器翻译模型的规则选取问题进行研究,这是因为基于层次短语的翻译模型的调序能力主要依赖于层次规则,而统计模型的加入往往可以帮助选择更好的层次规则并带来性能的提升。对于一条层次规则,它包含源语言部分和目标语言部分。源语言部分会引入不恰当的匹配结果,而目标语言部分不恰当的选取会进一步引入调序结果的错误。前人的工作仅仅关注解决源语言规则的匹配或者仅仅关注目标语言规则的选取,但却未曾尝试同时解决这两个问题。本文提出了联合的规则选取模型,同时考虑源语言规则的匹配以及目标语言规则的选取,将这两个问题紧密地关联在一起,在较大的搜索空间中希望找到更好的翻译结果。新模型建立在四个子模型的基础上,并且使用了丰富的上下文信息特征来指教规则的选取。除此之外,我们提出的方法可以在对数线性框架下方便地加入到现有的统计机器翻译系统中。实验结果证明,这种方法不仅可以显著地提高基准系统的性能,而且相比前人工作也有显著的进步。
其他文献
在“文景转换”系统中,要针对输入文本生成相应的三维动画,就必须首先运用自然语言处理技术,全面地理解文章中的场景信息。为此,我们提出了面向“文景转换”系统的场景识别的
近年来,随着统计机器学习技术的不断发展,对句子进行语义分析逐渐受到重视起来。语义角色标注(Semantic Role Labeling, SRL)是浅层语义分析的一种可行方案,并具有广阔的应用
随着互联网的迅速普及,它已经成为我们生活中不可或缺的一部分,在它带给我们极大便利的同时,网络安全也越来越受到人们的关注。即时通讯,作为网络的一个重要分支,也自然成为
自动表情识别Automated Facial Expression Recognition,缩写FER)赋予计算机感知并尝试理解人类情感的能力。在计算机视觉、人机交互和情感计算领域都有着非常重大的研究和应
无线传感器网络是由大量具备感知、计算和通信能力的传感器节点组成的以数据为中心的自组网络,已经广泛应用于医疗监护、军事侦察、环境和交通监测、空间探索和灾难救助等领
对等网络作为一种新的网络应用模式提高了网络的工作效率、充分利用了网络带宽、开发了每个网络边缘节点的计算和存储能力、容错性好、可扩展性强,因此其在文件共享、多媒体
BitTorrent协议的出现,特别是DHT(Distributed Hash Table,简称DHT)网络的快速发展,给文件共享和下载方式带来了一场变革。DHT网络的用户规模和文件数量近几年来呈爆炸性的增
学位
随着互联网的普及和电子商务的发展,推荐系统在电子商务系统中起着越来越重要的作用。它可以将电子商务网站的浏览者变为购买者,提高电子商务网站的交叉销售能力,保留已有用
随着遥感技术以及高分辨卫星技术的发展,当今社会对高分辨率遥感卫星数据的存储以及访问的需求在越来越大,另外随着分布式技术在大数据的环境下发展也越来越成熟,也有越来越