【摘 要】
:
针对汉、维翻译中维语形态变化复杂、汉维语句法结构不同等造成的解码局限性问题,将解码中语言模型的评分调整为重点考虑短语衔接处的单词串的得分,引入词向量进行短语相似度
【机 构】
:
中国科学院新疆理化技术研究所,中国科学院大学,新疆维吾尔自治区科学技术厅新疆民族语音语言信息处理实验室
【基金项目】
:
新疆自治区重点实验室开放课题基金项目(2015KL031),新疆自治区重大科技专项课题基金项目(2016A03007-3),新疆维吾尔自治区自然科学基金项目(2015211B034),中国科学院青年创新促进会基金项目(2017472).
论文部分内容阅读
针对汉、维翻译中维语形态变化复杂、汉维语句法结构不同等造成的解码局限性问题,将解码中语言模型的评分调整为重点考虑短语衔接处的单词串的得分,引入词向量进行短语相似度计算,利用词向量将单词间隐含的语义关系加入到解码评分;调整解码的调序距离限制方法,设计一个限制解码中短语扩展的方法,使解码的调序更符合汉维翻译的实际;在此基础上,按优化的方案实现解码器。实验结果表明,优化能使译文BLEU值在基线方案基础上提升3.46,最终方案解码器的译文BLEU值为29.18。
其他文献
经常性思想工作是部队的一项基础性工作,直接关系到部队的稳定和官兵的成长进步。当前,官兵思想日益活跃,影响官兵思想稳定的因素日趋复杂,这对部队经常性思想工作提出了新的要求
为加快算法的收敛速度和寻优能力,将粒子群算法和差分进化算法的优点结合起来,提出一种混合差分进化算法。在此基础之上引入一种新型的变异策略(包括全局变异和局部变异两种),
在我国的农业生产中,施用化学钾肥是土壤速效钾的主要补充途径。据资料显示,中国钾肥的生产量只占世界的0.34%,而消耗量却占到14.70%,虽然每年进口 200多万吨钾肥,却仍然不能
为大规模自动构建语料库,使计算机能够理解文本信息,提出框架自动识别,框架排歧作为框架识别的子任务,是亟待解决的。框架排歧即根据目标词的上下文信息,从现有的框架库中,自
军委胡锦涛主席强调指出,领导干部要进一步增强事业心和责任感,把从严治军的要求真正落到实处。作为军队领导干部,要贯彻落实胡主席的重要指示,从严治军,就要强化干劲、闯劲、狠劲
伴随着我国经济社会的快速发展,我国大中城市普遍存在着交通拥挤、车辆堵塞等现象,城市交通拥堵困扰着政府和百姓。然而我国许多人口密度大的城市人均建筑用地仅为50m~2左右,