统计机器翻译中汉维短语对抽取的研究

来源 :新疆大学学报:自然科学版 | 被引量 : 0次 | 上传用户:l907603912
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
双语短语对抽取是基于短语的统计机器翻译中短语翻译模型训练的关键步骤,但由于汉维平行语料库规模有限,数据稀疏问题严重.本文提出了一种改进的短语抽取算法,该算法首先考虑词对齐矩阵中一个汉语词对齐到多个维吾尔语词的情况(包括不连续),然后利用Och方法抽取短语对,最后考虑维吾尔语SOV语序结构特点,抽取双语短语.实验表明,该算法能够较准确地且尽可能多地抽取汉维短语对,从而提高翻译模型的质量.
其他文献
文章介绍了直立高填方区边坡治理工程中应用的一种新型、快速锚固技术的研发过程,阐述了预应力混凝土管水平向快速锚索的力学原理及其构造、特性,并结合工程案例,介绍了新型锚素
由中国岩土锚固工程协会主办,西南有色昆明勘测设计(院)股份有限公司协办的第二十一次全国岩土锚固工程学术研讨会,于2012年10月22日至24日在昆明市召开。出席会议的有来自全国铁
近日,江苏省国土资源厅出台《关于推进国土资源生态文明建设的意见》,明确国土资源领域推进生态文明建设的五大目标22项工作任务。一是国土资源在生态文明中的效应进一步扩大
首先对当前的移动增值业务发展当中存在的不足做了分析,从而引出SP接入MISC平台正向与反向接口系统设计的意义和目的。重点介绍了该系统的整体框架、关键技术及主要模块的功能
本文主要讨论将N-gram模型与编辑距离算法运用于印刷体维吾尔文识别后处理.由于印刷体维吾尔文识别系统的识别错误有一定规律性,所以研究中对识别错误进行了比较、分析、分类、
上世纪80年代初,锚索加固工程要求安装观测锚索,大变形岩体的加固要用无粘结锚索,工程需要催生了国内的无粘结锚索。当时还没有无粘结钢绞线,只能用光面钢绞线自制,因此,无粘结锚索
<正>加强地质灾害隐患综合治理事关人民群众生命财产安全,事关乐清市高水平全面建成小康社会。大力推进土地综合整治,实现耕地占补平衡,是促进乐清经济社会发展、实现重大项
期刊
近两年来,天津市坚持以创新为引领,不断探索节约集约用地模式,向“六度空间”要地。最新统计结果表明,天津建设用地较三年前下降39.9%,单位固定资产投资建设用地、单位GDP增长消耗新
以《新疆大学学报》2009年以来载文为研究对象,运用文献计量学原理统计分析期刊载文量,基金论文比,作者及合著情况,引文率,引文种类,引文文种,引文年距等指标,通过对这些数据
良好的盈利能力对商业银行的持续发展和稳健经营至关重要。本文在确定商业银行盈利能力评价指标体系的基础上,运用模糊数学分析方法构建了我国商业银行的盈利能力评价模型,并进