统计机器翻译中双语语料的过滤及词对齐的改进

来源 :智能计算机与应用 | 被引量 : 0次 | 上传用户:ali5000
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
词对齐是统计机器翻译系统中最重要的一个环节,统计机器翻译中的翻译模型和调序模型都是在词对齐结果的基础上构造的,词对齐阶段出现的错误,会延续到这些模型中,甚至会因为词对齐的错误而在这些模型中引发更大的错误。为减少词对齐阶段的错误,提出一种基于对齐困惑度的双语语料过滤方法和一种改进的判别式词对齐算法,语料过滤方法可以将词对齐阶段有严重错误的双语句对过滤掉,判别式词对齐算法与传统的自动词对齐算法相比,可以得到对齐错误率更低的词对齐结果。
其他文献
目的:探讨小切口非超声乳化白内障人工晶体植入手术的临床效果。方法:对50例(50眼)施行非超小白内障囊外摘出人工晶体植入术。结果:术后最佳矫正视力≥1.0者40眼(80%),≥0.5者8例(16%),无
歌剧,作为一门综合性艺术,融合戏剧、音乐、表演、舞蹈、服饰、化妆、舞台灯光、布景等多种艺术元素于一身。这样一种综合性的艺术形式,它的迷人之处在于多种艺术形式综合无
伴随着网络化、信息化和数字化在农业农村经济社会的不断发展应用及农民现代信息技能的提高,数字乡村已成为乡村振兴的重要发展方向。$$前不久,农业农村部与农业银行签署了金融
报纸
眼底视网膜血管的分割在眼底视网膜血管病变分析和心脑血管疾病诊断中具有重要的临床应用价值。针对现有视网膜血管割算法分割出的血管边界不够精确光滑以及对低对比度血管分割效果不理想等问题,本文提出一种改进的B样条Ribbon Snake模型,对视网膜图像中的血管进行分割。该方法首先对眼底视网膜图像进行亮度均衡化、去噪等预处理操作,再利用方向线检测算子对血管中心线进行提取,最终在传统B样条Ribbon Sn
大家都知道,发动机冷却系的作用就是在发动机的工作当中,维持发动机在80℃~90℃的最佳工作温度范围内,以使发动机的工作能力最高,经济系最好,排放污染物最少,使用寿命大大延长
本文对155例肝病患者进行PA及ALB,丙氨酸氨基转移酶(ALT)检测,旨在探讨PA在临床中的应用价值。通过统计学处理,各组肝病患者PA值均明显低于正常对照组(P〈0.01),但各组PA,ALB,ALT测定结