【摘 要】
:
近年来,深度学习的应用不仅在图像识别、文本生成等领域表现突出,在自然语言处理方面也效果显著。自然语言处理系统在生活中比比皆是,比如手机智能助手在理解用户请求之后,就能通过文字或语音的方式反馈用户信息。人类之间主要通过语言的方式进行沟通交流,以达到知识分享、扩展人际关系等目的。然而,目前全球在使用的语言超过五千种,要想精通多门语言是一项艰巨的任务。此时,机器翻译作为自然语言处理领域中的一个重要分支部
论文部分内容阅读
近年来,深度学习的应用不仅在图像识别、文本生成等领域表现突出,在自然语言处理方面也效果显著。自然语言处理系统在生活中比比皆是,比如手机智能助手在理解用户请求之后,就能通过文字或语音的方式反馈用户信息。人类之间主要通过语言的方式进行沟通交流,以达到知识分享、扩展人际关系等目的。然而,目前全球在使用的语言超过五千种,要想精通多门语言是一项艰巨的任务。此时,机器翻译作为自然语言处理领域中的一个重要分支部分,在保留原始语义的条件下,实现了不同语言之间的等价变换,是与世界其他地区进行沟通交流的重要工具。而今,神经机器翻译技术与以往的机器翻译方法相比较,神经机器翻译模型效果较好。但是,神经机器翻译模型较少考虑到语言学知识的重要性。若能在翻译过程中融入语言的句式结构和语义信息,就能起到辅助神经机器翻译模型的作用,从而提升翻译句子的准确性。本文由此提出基于句法规则层次化分析的神经机器翻译模型,通过结合改进的句法分析方法来提高翻译质量。本文首先从句法分析入手。目前对于句法分析的研究,大多数是从字、词的角度考虑,存在一定的局限性。因此,本文利用句子成分之间的语法结构关系对词性、词序的影响,提出一种二元与三元词相结合的句法规则层次化分析算法,实现语句的层次化分析。结果表明,句法规则层次化分析算法的结合模型相比于独立二、三元词模型效果较好,其准确率和召回率分别达到了82.04%,80.83%;与现有基于二分结构句法分析的序列标注模型算法和词汇化模型算法相比,准确率和召回率均有明显提升。实验证明本文提出的二元与三元词相结合的层次化分析算法具有可行性。句法分析在机器翻译中占据着重要的地位。本文利用分治法的思想,对句法规则层次化分析算法进行改进,并融入到神经机器翻译模型中。通过句法规则层次化分析算法,识别并分离句子的主干部分和最长短语,再训练基于自注意力机制的Transformer模型,对最长短语和句子主干部分分别进行翻译之后再组合,得到最终译文。结果表明,在中-英机器翻译任务上,翻译结果BLEU值相较于基准实验提高了0.95个点,证明该方法能显著提升翻译性能,并且对于句式结构复杂的长句翻译效果更佳。
其他文献
城市地下管廊是城市地下空间的重要组成部分,对其实现三维模型重建是当下难点。传统的基于二维平面数据完成的建模已很难直观和精确地表现出地下空间场景,随着三维激光扫描技术的发展,基于激光点云数据完成的三维模型更加美观和精确,而要实现模型的快速重构,对点云进行语义分割是模型重建的关键技术之一。PointNet网络是直接将点云作为输入进行语义分割的开山之作,本文针对原网络在局部特征提取不足的缺点,对其网络结
复杂网络作为近几十年科学领域的新兴研究领域之一,受到了国内外广大科研工作者的广泛关注。总体而言,有关复杂网络的研究大致可以分成从微观角度和宏观角度两个研究方向:从微观角度的研究主要是从个体特性出发,研究复杂网络中的各个节点与网络特性的动态关系;从宏观角度的研究则主要从全局出发,利用图论、概率论与统计学的思想分析全局网络的动态和稳态特征。在近半个世纪的研究中,科研人员们结合代数图论、概率论、控制理论
机器视觉检测技术因不易受环境条件影响,生产成本低,安装灵活,只用在相机里安装对应的检测模块即可等优势,被应用于越来越多的领域。图像内容表示模型是机器视觉检测过程的重要环节,图像内容表示模型的不同构建方式影响机器视觉检测的应用场景。本文从应用于工业领域产品缺陷检测的角度出发,提出一种基于混合高斯的表示模型。现有的图像表示模型较多直接以检测目标为整体建模或需要大量的矩阵运算,存在对检测目标较小的细节变
坡度频率分布是定量化研究地形坡度分布的一种常用方法,以全球陆地为研究区计算坡度频率分布,能够为进一步了解地球表面地形坡度分布特征提供信息,并为相关地学研究提供一个标准统一的参照系。本研究首先从空间分布和频率分布两个方面对比了现下主流30m分辨率DEM数据集:ASTER GDEM v3.0和SRTMGL1 v3.0,对坡度表达的稳定性,并最终证明了30m分辨率下SRTMGL1 v3.0数据产品更适用
同一场景可以通过多种传感器捕获多幅图像,每一图像包含不同信息,图像融合技术就是整合多个图像的互补信息,使融合后的图像对场景描述更加全面和清晰。如今,图像融合技术已广泛应用于遥感探测、医学诊断、国防安全、工业检测等领域。然而,现有融合技术仍然存在一些亟待解决的问题。比如,当要融合的图像受损时,现有的融合方法无法在融合处理过程中恢复出丢失信息。通过图像融合和矩阵完备的逐步操作可部分恢复图像的丢失信息,
发动机作为汽车的核心部件,具有类型繁多,结构复杂、零部件数量多等特点,其维修是汽车维修过程中的重点和难点。在发动机故障维修工作中,存在故障原因查找困难、零部件结构认知不准确、维修操作过程不规范、维修效率低等问题,仅依靠维修人员的维修经验和查询维修手册等传统方法很难保证发动机故障准确高效的维修需求。目前针对发动机故障维修主要依靠电脑诊断软件故障和维修人员依据故障现象和经验查找硬件故障这两种方式,而在
髋关节发育不良是一种在青少年和成年人群中常见的骨关节疾病。正常人的髋臼髋关节中心与股骨头中心近似重合,由于髋臼的发育缺陷导致髋臼的深度变浅、坡度变大从而使股骨头与髋臼的接触面积越来越小。髋臼与股骨头之间的受力面积减小,接触应力峰值增大,进而产生应力集中。应力集中会造成关节软骨的过度磨损,损坏关节软骨,最终发展成为髋关节骨性关节炎。髋臼周围弧形截骨术是治疗髋关节发育不良的一种新型的治疗方式。目前国内
铜电解是铜冶炼过程中的重要工艺,常因多方面电解工艺因素的影响,致使阴极铜板表面出现结瘤缺陷,严重影响其表面质量。考虑到在人工识别该缺陷的过程中,受内、外多方面因素的干扰,致使操作人员对铜板表面结瘤缺陷结果产生误判,影响最终决策合理性。针对上述问题,本文提出一种结合混沌鸟群算法的铜板结瘤缺陷图像识别方案,旨在提高企业生产的智能化,同时降低生产成本。主要工作如下:(1)分析了不同视角下采集铜板图像的差
赋有可变二维码的烟标因其在防伪溯源、宣传营销等方面的优势正逐渐成为主流的烟草包装形式。随着印刷企业赋码作业规模的持续扩大,其生产质量不稳定,印刷精细程度无法保证的缺陷越发突出。针对此问题,本文基于目前印刷企业中烟标可变二维码的整体喷印流程,首先进行了可变二维码喷印过程的数值模拟及墨滴形态的分析;其次进行了二维码喷印工艺参数对二维码符号等级的影响研究;最后对烟标可变二维码喷印质量优化进行了实验研究。
车联网(Internet of Vehicles,Io V)是一种因特网在车辆领域的应用。车联网的基础是车载移动互联网,并通过相关的通信协议相互连接的大型通信网络。在智能交通领域,Io V是最重要的组成部分。Io V负责将车辆相互连接起来,以达到消息共享、消息通信的目的。由于Io V开放的特性,攻击者可以截取实时广播的信标信息,通过分析所截取的信标信息获取驾驶人员的习惯、车辆运行的轨迹、驾驶人员的