【摘 要】
:
该文将深度学习技术应用于汉藏机器翻译任务中,采用了编码器-解码器结构.在编码阶段,首先将汉语句子中的每个词映射为定长的词向量,并通过循环神经网络压缩整个句子的全部信息.在解码过程中引入注意机制,使得解码器更集中的去注意当前翻译词的上下文依赖词,并每次选择概率最大的翻译词生成目标句子.该文使用上述方法在以法律文本、政府公文、新闻为主的书面语语料和口语类语料上进行实验.实验数据表明,在书面语语料上,N
【机 构】
:
中国科学院软件研究所,北京 100190;中国科学院大学,北京 100049 中国科学院软件研究所
论文部分内容阅读
该文将深度学习技术应用于汉藏机器翻译任务中,采用了编码器-解码器结构.在编码阶段,首先将汉语句子中的每个词映射为定长的词向量,并通过循环神经网络压缩整个句子的全部信息.在解码过程中引入注意机制,使得解码器更集中的去注意当前翻译词的上下文依赖词,并每次选择概率最大的翻译词生成目标句子.该文使用上述方法在以法律文本、政府公文、新闻为主的书面语语料和口语类语料上进行实验.实验数据表明,在书面语语料上,NIST 和BLEU 值分别达到了6.39 和0.296,在口语语料上,NIST和BLEU 值分别达到了5.41 和0.222.在相同的语料上,以短语为基本单元的Moses 翻译模型的性能,书面语语料NIST 和BLEU 值为6.98 和0.335,口语语料NIST 和BLEU 值为6.24 和0.272.
其他文献
本文提出了一个基于区间二型模糊集合的交通流长时预测框架及其实现方法,用于预测未来一天的交通流量数据.该框架分为三个模块:交通流数据预处理模块、二型模糊化模块和交通流数据长时预测模块.本文引入置信区间概念,应用中心极限定理,针对大量实测交通流数据进行处理,较好的描述了交通流数据的随机性和不确定性.其预测的交通流数据结果是由上限预测曲线和下限预测曲线包围的一个区域,给出了交通流预测结果及其变化区间.最
Internet inquiry is playing an increasingly important role as the complement of the traditional medical service system,especially the similar cases recommendation.It can not only save the patients wai
针对高速公路交通特点设计了单向双车道元胞自动机模型,重点考虑车型分类、不同车型车辆构成比例、不同车型车辆期望速度、不同类型驾驶员驾驶同一车型车辆不同期望速度、道路限速值大小、大车靠右行驶规则等高速公路车辆组成和行为、规则特征,并融合高速公路行驶车辆考虑后车压迫下的强制被动换道行为,对车辆的行驶规则进行了进一步的约定,使文中的元胞行为与实际高速公路交通流更加接近.在上述模型的基础上进行元胞自动机仿真
互联网问诊平台中的相似病例推荐系统在发挥着越来越重要的作用,相似病例推荐属于推荐系统应用于在线医疗领域的一大突破.相似病例推荐所涉及的语义相似度的计算作为自然语言理解领域的重要内容,在人工智能以及推荐系统中发挥着重要的作用.在互联网在线问诊中,许多的患者会面临同样的疾病,同一个医生也会面对具有相同病情和症状的患者.因此,当用户提交自己的症状描述时,能够将与该症状描述语义相似的历史病例和医生回答推荐
"意外"(mirativity)范畴,研究"出乎意料"的信息所引起的说话人的情绪反映,它是"感叹"范畴的一个子系统.根据考察,至少对汉语来说,副词化形式(adverbialized form)与感叹语(语气词与叹词)是两种最重要的意外表达形式,它们是开放的类,数量众多,并有很多不同的小类,尤其是前者,似乎不断地有着新的形式加入进去,不断地丰富着意外范畴的库藏形式.其他如特殊的疑问代词、特殊的谓词或
本文首先描述了现代汉语普通话中“不敢”表示道义情态[一许可]的现象,这一现象在前人的研究中常常被忽视。接下来,论证了“不敢2”具有两个区别于其他[一许可]义结构的特点:“不敢2”具有“低正式度”的语体特征;“不敢2”只能用来提出道义要求,而无法用来陈述道义的存在。然后,描写了分化,“不敢”的动力情态和道义情态这两种情态歧义的条件。具体来说,“不敢2”的主语必须包含听话人,“不敢2”无法处于认识情态
有幸出席"第五届海外中国语言学者论坛",借此机会向语言学家请教两个问题.第一个问题是比对现代汉语词语归类结果的工作有没有价值,值不值得做下去?笔者在合作伙伴的支持下,拟全面比对《现代汉语语法信息词典》(电子词典)与《现代汉语词典》(第5版)这两部词典的词语分类体系以及数以万计词语的实际归类结果,本文介绍这项工作的目标、做法和已经取得的数据.第二个问题是笔者提出的将普通话的5个声调重新命名为"高声、
深度神经网络是深度学习技术的代表,是一种模拟人脑的计算模型,已经在人工智能的很多领域取得了突破性的成果.基于神经网络的机器翻译是利用深度神经网络进行源语言到目标语言转换的技术,与传统的统计机器翻译技术有着很大的差别.虽然基于神经网络的机器翻译结构十分简单,但是其达到的翻译效果已经接近或者超过传统的基于短语的机器翻译技术.本文提出了一种基于神经网络的维吾尔语到汉语的机器翻译方法.通过实验证明,在特定
近年来,基于统计的机器翻译技术快速发展,如何准确快速的评价机器翻译系统之间的性能差异是一个研究的热点问题。通常,基于统计的机器翻译方法利用定义好的自动评价标准,在标准的测试集上计算系统的得分(如BLEU 值、NIST值等),然后根据得分的相对大小来确定系统之间的差异大小。研究发现这种仅依靠得分大小来判断系统差异的方法并不完全可靠,尤其是在系统得分差异较小的情况下,需要进一步利用显著性检验来度量系统
科技术语翻译要求高度的准确性和专业性,通过建立术语语料的领域知识标签,并基于待翻译术语的领域对训练语料进行筛选,可训练出针对领域的翻译模型,能极大改善科技术语翻译质量.这对于机器翻译、词典自动编纂、跨语言信息检索等自然语言处理任务都具有重要的实用价值.本项研究以日汉科技术语翻译为研究目标,通过自动获取日语术语的二维领域知识,包括语义范畴标签和应用场景标签,可以对日语术语进行领域归类.该方法应用到统