【摘 要】
:
多领域机器翻译一直以来都是机器翻译领域研究的重点,而短语归纳是重中之重。传统加权的方法并没有考虑到整个归约过程,本文提出了一种使用层次化的Pitman Yor过程进行短语归
【机 构】
:
哈尔滨工程大学计算机科学与技术学院; 哈尔滨理工大学; 哈尔滨工业大学;
【基金项目】
:
国家自然科学青年基金(编号:61300115);中国博士后科学基金(编号:2014M561331);黑龙江省教育厅科技研究项目(编号:12521073)
论文部分内容阅读
多领域机器翻译一直以来都是机器翻译领域研究的重点,而短语归纳是重中之重。传统加权的方法并没有考虑到整个归约过程,本文提出了一种使用层次化的Pitman Yor过程进行短语归约,同时把多通道引入到模型中,使得在短语归约的过程中平衡各领域的影响。从模型角度,本文的方法为生成式模型,模型更有表现力,且把对齐和短语抽取一起建模,克服了错误对齐对原有短语抽取性能的影响。从复杂度上来说,该模型独立于解码,更易于训练。从多领域融合来说,对短语归约过程中进行融合,更好的考虑到整个归约过程。在两种不同类型的语料上验证了机器翻译的性能,相对于传统的单领域启发式短语抽取和多领域加权,BLUE分数有所提高。
其他文献
以乳清分离蛋白(Whey protein isolated,WPI)、大豆分离蛋白(Soybean protein isolated,SPI)和豌豆分离蛋白(Pea protein isolated,PPI)分别与麦芽糊精作为复合壁材,卵磷脂作为乳化剂,通
目的研究妊娠期糖尿病(GDM)患者血清中血清胆固醇(TC)、总胆红素(TBil)、尿酸(UA)以及尿微量蛋白(m Alb)等糖脂代谢指标的早期检测对GDM患者以及新生儿结局的临床价值。方法选择2013年1
致密油是致密储层油的简称,主要包括致密砂岩油和致密碳酸盐岩油2种类型,自从致密油的概念被提出以来,逐渐得到国内外专家学者的广泛接受和采用,成为继页岩气之后全球非常规
鉴赏古典诗词大多从标题、意象、注释入手,其实,抓住诗歌的末尾句、感情词和诗人的行为动作更能直接把握诗歌的思想感情,而意象和注释则要做具体分析,不能与诗歌的思想感情直接对
20世纪90年代以来,全球价值链逐渐兴起并迅猛发展。中国制造业依靠劳动力、自然资源等初级生产要素禀赋优势成功嵌入到了全球价值链体系当中。随着参与程度的提高,中国已经成
为了解某新建预应力混凝土现浇连续箱形梁桥的施工质量及实际工作状态,首先运用MIDAS CIVIL有限元分析软件建立该桥的梁格分析模型,分析其在设计荷载作用下结构变形与应力状
目的构建含有雌激素受体配体结合域的哺乳动物细胞杂交基因报告系统,研究骨科相关中药对雌激素受体(ER)活性的影响。方法PCR扩增雌激素受体配体结合域,将配体结合域克隆到真
2019年年初,国务院印发《"无废城市"建设试点工作方案》,提出在2020年形成一批可复制、可推广的"无废城市"建设示范模式。为响应国家政策,12月14日-15日,由中华环保联合会主
洛阳新出北魏元泰墓志,志主元泰,系北魏皇室族人,其墓志的发现为进一步研究"河阴之变"的历史有一定的借鉴作用。该志书刻皆精,其字体结构端工而疏朗,用笔秀润而挺拔,是研究魏
<正>有人说,如果没有阿诺特,迪奥可能早已香销玉殒,LV也不过是被祖母遗弃在床底的旧梦,思琳最多还在地摊上苦苦挣扎……2019年全球奢侈品行业最大规模的资本并购终于有了眉目