语篇分析及其在神经机器翻译的应用

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:magutosh
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语篇分析系统是分析自由文本中存在的语义关系的系统,包括显式关系与隐式关系,两者的区别在于语义关系中间的连接词是否在文本中明文出现。语篇分析在确定文本单元之间的关系及位置,以确定文本块、句子以至于段落之间的关系上有着极其重要的作用。语篇分析分为若干子任务,包括确定连接词,确定连接词连接的两部分文本块之间的关系,确定被连接的文本单元区间等,而长久以来无论是显式还是隐式关系,各个部分的实验结果并不够使人满意。各项结果还有比较大的提升空间。机器翻译是利用了现代计算机系统,完成了在不同自然语言之间进行文本的自动转换,具体是将输入的某种语言的句子翻译成另外一种语言中意思尽可能相同的句子的任务。这在信息学方面有重要的应用。经过多年来大批研究员几十年的不懈努力,机器翻译的研究取得了长足发展,翻译效果不断提升,但机器翻译的结果还是差强人意,在很多应用场合中并不能直接使用。主要缺陷是,传统的机器翻译是基于短语或词的统计机器翻译,作为一种机器学习任务,其模型结构复杂,训练及翻译过程非常耗时,而且经过几十年的发展,翻译质量已经达到瓶颈,很难再有显著的提升。本文研究了语篇分析与机器翻译两个不同的领域,分别对两者进行了研究。在语篇分析方面,根据国内外现有的工作以及自身的创新研究,制定出了直观高效的语篇分析策略,致力于提高语篇分析各个子任务的效果,比如识别准确率。在机器翻译方面,研究领域内表现优秀的神经网络模型,进行提升与改进,完成更高效的神经机器翻译系统。然后将语篇分析与机器翻译进行了结合,把语篇分析的特征引入到机器翻译系统中,以提高机器翻译系统的翻译结果。本文对两个部分的实验系统的结果分别进行了评测,实验结果也证明了语篇分析对优化机器翻译结果的有效性。
其他文献
设G为n阶3-连通无爪图,δ=min{d(x)|x∈V(G)},δ=min{maxd(x),d(y))|x,y∈V(G),d(x,y)=3},则C(G)≥min{n,3z+δ,6δ},用反证法,若图G的最长不满足结论,利用G的3-连通性和无爪性构造矛盾。
本研究探讨雷帕霉素对白血病细胞株的增殖抑制作用及其对细胞周期的影响,并分析该药作用前后mTOR mRNA表达水平的变化。采用四唑氮蓝比色试验(MTT)观察雷帕霉素对白血病细胞株KG
介绍了一个面向对象的智能的数据流图辅助生成系统,简述了系统的功能,系统的对象结构以及主要对象的数据结构,并提出了数据流图的形式化定义,在此基础上讨论了数据流图完整性约束
采用BP神经网络方法预报连轧精轧机组轧制力,通过训练数据预处理,利用遗传算法优化网络结构和参数、按钢种划分训练样本等方法,提高了网络的预报精度,优于传统的数学模型方法,BP神经网
考虑一类具有关联项耦合而成的对称组合奇异系统,本文证明:此类系统的可解性,能控性,能观性及强解耦的判别问题可转化为对两个独立子系统的相应问题的判别。
采用机械合金化法制备Al-V-Fe纳米粉末,通过测定Mossbauer效应,研究了不同球磨能量对制备Al-V-Fe纳米粉末的影响。结果表明,振动球磨与高能球磨所制备的Al-V-Fe纳米粉末结构均由非晶和α-Al纳米晶组成,其非晶含量随
肿瘤干/祖细胞是肿瘤组织内具有自我更新、分化成为肿瘤组织内所有细胞群体及持续增殖能力的起始细胞,被认为是肿瘤复发、耐药以及转移的根源。急性早幼粒细胞白血病(acute pr
骨髓增生异常综合征(MDS)是一组异质性克隆性疾患,迄今其病因和发病机制尚知之不多。近年来发现MDS患者存在表观遗传调节子(epigenetic regulator)基因如TET2、ASXL1、EZH2、DNMT
作为钢中重要的微合金元素,钛既可以细化钢的晶粒,又具有良好的第二相强化作用,同时还具备明显的成本优势,因此低碳钛微合金钢在工程建设领域获得了广泛的应用。作为钢中重要
通过实验得出,铁法矿务局煤泥水不经加药处理,污泥比阻r=31.6*10^11cm/g,该值太大,属于极难过滤污泥,经过加药处理后,r=0.057*10^11cm/g,该值变小,可以采用机械脱水设备进行脱水。