基于领域自适应方法的统计机器翻译模型的优化研究

来源 :科学技术创新 | 被引量 : 0次 | 上传用户：zjundu1980

【摘要】

：

本文引入领域自适应这一方法,对现有的统计机器翻译词对齐方法进行改进,其中主要过程是首先运用最大熵分类器方法对大规模双语平行语料进行筛选,再通过LDA模型对双语平行语料

【作者】

：

杨玲

【机构】

：

武警工程大学

【出处】

：

科学技术创新

【发表日期】

：

2021年5期

【关键词】

：

词对齐领域自适应统计机器翻译

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

本文引入领域自适应这一方法,对现有的统计机器翻译词对齐方法进行改进,其中主要过程是首先运用最大熵分类器方法对大规模双语平行语料进行筛选,再通过LDA模型对双语平行语料进行主题提取,然后训练每个主题对应的词对齐模型,进而得到翻译模型和语言模型。运用这种方法提高了翻译结果的准确率,使所得到的译文结果更符合人们平时交流的习惯。

其他文献

easy go——易行(智能导盲杖)

我国视障人群高达1700多万,且年增长率连年上升。视觉上的缺陷带来的生活不方便,尤其是外出时还会引发安全事故。研究一套便捷的能够随拿随放的智能导盲控制系统,帮助视障人

期刊

物联网视障人群导盲杖系统设计

小学语文成语故事教学策略研究

一、小学语文成语故事教学的主要内容1.静态层面。一是读音。一些成语中的字虽然和现在的字一样,但是它的读音与现代的字不同,学生容易读错,导致其不能正确理解成语意思。例

期刊

成语故事小学语文形近字强化训练读音错误教学策略研究读音教学曲高和寡

基于烟花算法的分子构象搜索方法

分子对接算法中的构象搜索方法对于分子对接的效率至关重要,本文提出一种基于烟花算法的分子构象搜索方法旨在提高分子对接的速度,实验结果表明烟花算法在解决蛋白质-配体对

期刊

烟花算法分子对接构建

高山蔬菜集约化育苗技术分析

集约化育苗已经成为高山蔬菜种植中的重要育苗方案,但是在育苗过程中,种植人员仍需结合地区实际情况,以及高山蔬菜的特点,科学制定育苗方案。因此,对高山蔬菜的育苗方式展开

期刊

高山蔬菜集约化育苗技术漂浮育苗

高比例水电孤网的振荡抑制与快速调频协调策略

研究了在满足电网频率要求前提下高比例水电孤网的振荡抑制与快速调频的协调策略。首先定义了水电机组调频优先级指标,为水电机组的调频优先级进行排序。其次基于调频优先级

期刊

水电孤网振荡抑制水锤效应调频策略hydropower isolated networkoscillation suppressionwater ha

一种交直流系统连锁故障预测方法及风险评估

随着大容量直流线路的相继投运,交直流系统连锁故障预测模型的完善日益迫切。针对目前研究缺乏交直流相互作用过程的动态特性仿真,提出一种基于多时间尺度的交直流系统连锁故

期刊

交直流系统连锁故障多时间尺度换相失败直流调制AC-DC systemscascading failuremulti-time scalecomm

棉花化肥减量增效技术模式

以南疆阿拉尔片区棉花为主进行分析,针对出现的施肥过量问题研究出一种新的棉花化肥减量增效技术模式,希望能够给以后的棉花生产提供帮助。

期刊

棉花化肥增减技术模式

基于Ansys workbench康复训练支架的有限元分析

近年来,由于交通事故引发的下肢损伤的患者快速增长,仅仅依靠医疗人员帮助患者进行康复训练是难以满足的,因此,设计合理舒适的康复训练设备帮助患者恢复行走能力是很有必要的

期刊

下肢损伤的患者康复训练支架有限元分析

基于领域自适应方法的统计机器翻译模型的优化研究

其他学术论文