机器翻译在RS10云平台产品的应用 ——动态业务标签的在线翻译

来源 :机械科学研究总院 | 被引量 : 0次 | 上传用户:ahjockey
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着“一带一路”政策的实施、“十四五”规划的发布,北京机械工业自动化研究所自主研发的RS10产品,作为中国第一批工业管理软件,伴随着二十年的历史沉淀积极响应号召,进行了基于云平台数字化变革的产业结构升级和创新。人工智能技术作为RS10产品变革中关键性技术之一衍生出本课题。本课题结合政策背景、理论背景和RS10产品背景主要做了以下五个方面工作:第一、借助RS10产品多年积累的业务场景经抽取、泛化、语料清洗等处理构建了特属RS10工业制造业的高质量数据集。第二、本课题基于RS10云平台设计开发了前后台交互的动态业务标签功能,该功能支持同步维护业务标签信息、数据建模时的标签预定义、敏捷开发过程中的标签动态加载。第三、本课题融合神经机器翻译通过对Transformer的改进自主训练了三个中英文翻译模型,其中包括基准翻译模型一;随机选取目标词约束的翻译模型二;依赖双语字典选取词约束的翻译模型三。第四、为提高本业务场景下机器翻译的原文忠实度,本实验创新性地采用Mos es搭建训练了加入词对齐处理的统计机器翻译模型。经对比验证该模型翻译效果最优,并通过前后台将其集成应用到RS10产品中,最终实现了具有动态效果、灵活扩展和及时性的中英文在线翻译。第五、本文经梳理提供了一套机器翻译与工业管理软件结合应用的科研落地流程。结合以上工作,本课题实现的成果和贡献主要体现在四个方面:第一、RS10数据集的构建实现了RS10工业术语标准化,从而保证需求、设计、应用阶段工业元素在理解上的一致统一。第二、动态业务标签功能抽象出了对基础数据管理共性化需求,秉承模块化的开发方式满足了用户定制化需求,强化了系统的通用性和重构能力,最终实现了面向工业软件中业务需求不断变换的场景下,项目落地转换率的提高。第三、本实验训练出了RS10产品定制化翻译模型,保证了技术自主可控性。同时,该模型于在线翻译的功能应用经实际开发场景验证,可完全实现开发人员在开发过程中手动录入、不断变更标签工作的剔除,极大提升了开发效率。第四、本课题具备的模型训练流程,为今后RS10云平台支持多语言翻译研究,机器翻译和生产管理软件的结合研究提供了样本,赋予了产品为今后中国制造业走向智能化、国际化、战略转型发展提供助力的价值。
其他文献
光催化制太阳能燃料,即利用可再生的太阳能驱动水分解或二氧化碳(CO2)还原,制备氢气(H2)、一氧化碳(CO)等可存储的化学燃料。光催化制太阳能燃料过程涉及光吸收、载流子传输、表面反应等关键步骤,且不同种类太阳能燃料的制备路径也不尽相同,这就需要光吸收材料与助催化剂材料乃至界面材料之间高效协同工作。胶体纳米晶具有活性位点丰富、组分和尺寸易调以及溶液加工性等优点,在太阳能转化领域具有广阔的应用前景。
学位
上世纪七十年代以来,随着认知科学的发展,隐喻和转喻研究从修辞学的视角更多地转向了认知语言学的研究。这种认知转向使得关于隐喻和转喻的研究迅速成为学界的热点,也使得隐喻与转喻和翻译仅限于修辞的关联扩展到了涵盖翻译过程在内的诸多方面。由于传统的隐喻和转喻修辞观,过去对隐喻和转喻的翻译研究仅局限在词句层面,过度纠结于隐、转喻翻译的形式和语义,而鲜少关注到译者翻译策略的抉择。认知科学介入以后,隐喻和转喻的涉
学位
汉语和泰语都大量存有可以表达说话者主观判断或评价的情态副词,这些副词中很多意思相近,给汉语学习者造成了很多困扰。此外,汉泰对译时,汉语中的情态副词存在被翻译成多对一或一对多的现象,学习这些副词对于泰国学生来说是一个难点。本文拟采取单向对比方式,将汉语的情态副词与泰语中的情态副词或其它对应词进行对比,结合相关理论方法,判断泰国学习者在习得汉语情态副词时可能遇到的问题。本文首先结合相关研究,确立情态副
学位
“官方语言选择”目前仍然是一些“多语种社会”所面临的棘手问题之一。非洲国家,尤其是撒哈拉以南的非洲国家,是典型的多语种社会的例子。自独立以来,这些国家在语言政策上便面临着很多问题。除了殖民统治遗留下来的外来语,这些国家还充斥着本来已有的“无数”本土语言。为了应对这个语言情况,多语种国家政府一般通过施行一些措施,比如依靠翻译,来确保每个公民能够更好地行使自己的语言权利。作为一个典型的多语种国家,喀麦
学位
内森·英格兰德是当代美国新生代杰出作家,也是当代美国犹太文学中最重要的小说家之一。英格兰德以其独特的人生经历为创作背景,密切关注着美国当代社会犹太人生活的真实风貌。他的作品深深扎根于移民美国的犹太人的民间记忆和正统犹太人的文化及信仰传统,描绘出一幅色彩斑斓的犹太社区生活画卷。他的作品深刻地揭示了当代美国犹太人在生活中渴望得到认同、渴望得到家人理解的心理,折射出缺失犹太文化传统对于一般犹太人来说具有
学位
近年来我国载人航天事业发展迅速,作为限制人类进行长期太空探索和驻留的最重要因素之一,空间辐照环境对生命体影响问题备受关注。鉴于此,在我校开展的重大科技基础设施项目“空间环境地面模拟设施”中,核心任务之一就是对质子微束辐照后无标记细胞的旁效应进行检测,从而揭示空间辐照损伤的规律及机制。“辐照旁效应”是指受辐照细胞产生损伤信号进而诱导辐照区外大范围未受辐照的细胞出现类似损伤的生物学效应。其有效范围最大
学位
在计算机技术的蓬勃发展以及国家大力倡导智能制造的背景下,制造行业开始不断往信息化和智能化方向发展。并且随着制造业的不断发展,其生产规模逐渐扩大,如果要提升其效率,单纯提升技术水平已不能满足要求。但目前制造业的信息化管理主要集中在订单管理、财务管理、人力管理等方面,缺乏对设备的加工进度管理。在大多数的制造行业项目中,通常会涉及外协加工设备,传统的管理方式是通过人工收集信息再手动更新设备状态,如果能够
学位
长沙窑是唐代一个重要的“彩瓷”窑口,以生产生活用瓷和对外贸易用瓷为主。在这个经济开放,观念开放的历史时期,人们对生活用瓷丰富性和多样性的需求呈爆发式增长,而长沙窑作为一个以满足市场及社会需求为主要生产目标的窑口,因此形成了独特的市场导向性的工艺特质和文化体系。在琳琅满目的唐代长沙窑瓷器中,有一个门类虽然总量很多,却一直以来未能受到学界的重视,那就是瓷盒。本文将唐代长沙窑瓷盒作为研究对象,通过资料搜
学位
乡村是我国社会构成的基本单位,是在物理空间中实际的存在,由于历史发展原因,具有鲜明的地域特征和文化内涵。在乡村进行艺术社区营造实践,需要依靠其特有的地域文化资源,而民俗是文化的核心,以乡村民俗节日的挖掘与重塑为具体实践路径,是丰富乡村公共文化服务体系的重要内容,从而形成乡村社区居民的文化自信,达到更好的进行乡村社区营造的目的。本文的研究尝试从乡村社区营造的视角,探索以艺术与美育为主的学科方法,进行
学位
“美国罗曼司”理论始于二十世纪四五十年代,认为美国小说与英国小说的区别在于其自身的罗曼司传统。该传统的特征主要表现为由库伯、霍桑、坡、麦尔维尔等作家所代表的冲突、抽象、自由、想象、反叛、乌托邦主义、个人主义、民族主义等。故而该理论提出了美国“罗曼司”这一文学体裁概念,将之与英国“小说”相对应。“罗曼司”成为了美国性塑造的重要政治工具。基于美国罗曼司传统仅限于小说体裁这一研究的局限性,本论文拟对美国
学位