平行语料相关论文
神经机器翻译的效果严重依赖于平行语料的规模和质量,而当前的平行语料抽取方法和生成方法只能提供规模足够但质量不佳的平行语料.......
期刊
简要介绍了EBMT的机器翻译方法和EBMT中的双语平行语料对齐问题.提出了一种基于短语内聚性的可应用于技术文档平行语料的短语对齐......
针对传统神经机器英语翻译依赖大规模、高质量平行语料库资源,导致对语料匮乏的英语内容翻译质量不理想的问题,研究提出一种基于边......
【目的】实现双语句子的自动对齐,为构建双语平行语料库、跨语言信息检索等自然语言处理任务提供技术支持。【方法】将BERT预训练......
随着计算机和互联网的发展,在自然语言处理领域,以双语(或多语)平行语料库为基础的应用日益增多。除机器翻译方面的应用之外,平行语料......
命名实体、术语的翻译对自然语言处理,机器翻译性能的影响越来越重要。在机器翻译领域,双语翻译词典是重要的翻译资源,但是传统的......
由于文化与地域的差异,中国大陆、香港和台湾(简称大中华区)在汉字的书写和表达习惯上均存在着一定的差异。从形态学角度看,香港和......
低资源神经机器翻译的研究难点是缺乏大量的平行语料来给模型进行训练。随着预训练模型的发展,并且在各大自然语言处理任务中均取......
平行语料库是机器翻译、跨语言检索和跨语言自动问答等自然语言处理(Natural Language Processing,NLP)任务的核心基础资源。平行......
本文提出了一种新的、基于拼接语音合成系统的韵律自适应模型。该模型能够利用目标说话人少量的语料使语音合成系统合成具有目标说......
有交流就有情态,且每种语言的情态表达方式各不相同。英语和汉语均有各自的情态表达体系,因此在英译汉过程中,情态的成功再现至关......
针对蒙文多文种文本(如传统蒙文TM,新蒙文NM及托忒文Todo)的互换显示需求,本文研究了基于短语的统计机器翻译技术的自动转写方法。......
双语平行语料库是多语种自然语言处理的重要资源,已被广泛地应用于机器翻译、机助人译、翻译知识抽取与跨语言信息检索等领域中。......
该文以阿勒泰语系下的维哈柯及蒙古语多语言平行文本和语音语料为研究对象,分别对比多语言文本量化序列向量及语音声学音律特征的相......
本研究对比《伊势物语》嵯峨本与《日本古典文学全集》现代日语语译,结合现代中国市面上的所有汉译本,建立平行语料库,并考察译本......
该文提出了一种从搜索引擎返回的结果网页中获取双语网页的新方法,该方法分为两个任务。第一个任务是自动地检测并收集搜索引擎返......
该文提出了一种从英汉平行语料库中自动抽取术语词典的算法。采用的是已对齐好的双语语料,中文经过了分词处理。利用英文和中文词性......
目前,在英汉平行语料中,对汉语文本的深加工多局限于只利用单语分析的成果,没有充分利用双语资源。以现代汉语v+n序列的结构关系为......
摘要 上海外语教育出版社英汉双语平行句对语料库建设是该社承担的上海市科委课题“双语词典编纂系统的研发”的子课题。该语料库......
双语术语抽取在双语术语词典编撰、双语本体构建、机器翻译以及跨语言信息检索中具有重要的作用。其中,双语核心术语是双语术语识......
本文研究了郝玉青的金庸小说《射雕英雄传》英译本,分拆对齐了原文和译文,制作了包含7 371条句段的双语平行语料。经过对原文和译......
丰富的平行语料库对提升机器翻译准确度意义重大,然而目前研究中缺乏有效的平行语料获取方法,本文提出一种从多语种网站中自动获取......
当今句子摘要研究主要针对单语,即源端句子和目标端摘要短语属于同种语言,然而单语句子摘要严重制约了不同语言文本信息的快速获取......
限定范畴是语言语法的基础和核心,在跨语言研究中占有重要地位。本文利用汉英平行语料库、翻译测试以及问卷调查研究汉英语言语序......
空间指示词(语)存在于所有语言中,是指示语的一个次类。19世纪末以来,空间指示词就被认为是一种非常重要的语言现象,是语言研究中......
自动语法改错(GEC),是自然语言处理中句法分析中较为困难的任务之一。在日常对话中,语法上的细微差别对于一个非母语的人来说是最......
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清......
文章讨论汉英语言的语序与限定范畴之间的关系。对900句对的汉英平行语料的名词短语类型和语序进行赋码。利用Paraconc检索和分析......
翻译的困难往往来自源语和目的语之间的语言和社会文化的差异,政论文体翻译尤其如此,因为政论文体翻译旨在对外宣传,介绍一国的大政方......
机器翻译是利用计算机实现不同自然语言间翻译的学科。统计机器翻译是当前主流的机器翻译方法,它以平行语料库为基础获取翻译知识,......
双语术语抽取是自然语言处理领域的一个重要课题,它被广泛地应用在机器翻译、信息抽取、双语信息检索、辅助机器翻译等方面。本文......
英语way构式结构相对固定、动词使用灵活多样且编码程度较高,为汉语再词汇化带来很大挑战。本文基于英汉双语平行语料,对way构式的......
在平行语料库的研究和利用成为语言学的研究热点的时候,如何搜集平行语料这一前提性工作却为研究者所忽略,本文就是在这一领域内的......
该文以阿勒泰语系下的维哈柯及蒙古语多语言平行文本和语音语料为研究对象,分别对比多语言文本量化序列向量及语音声学音律特征的......
提出一种基于完全独立的说话人语音模型进行语音转换的方法。首先每个说话人采用各自的语料训练结构化高斯混合模型(Structured Ga......
本文提出了一种从英汉平行语料库中自动抽取术语词典的算法。首先采用基于字符长度的改进的统计方法对平行语料进行句子级的对齐 ,......
【目的】对获取的双语语料进行分类,对分类后的双语语料进行句子对齐处理,生成领域平行语料。【方法】利用基于SVM算法的文本分类......
以中国传媒大学平行语料检索软件(CUC_ParaConc)为例论述平行语料检索技术,主要以纯文本形式的对齐语料为例进行阐述,包括平行语料的存......
平行语料库的规模对于统计机器翻译性能的提高具有重要作用,但是平行语料库的人工构建成本很高。针对这个问题,本文提出了一种低成......
为了实现多语种词对齐,该文提出一种以点互信息为基础的翻译概率作为改进的多语种单词关联强度度量方法。首先,论证了在服从Zipf定......