融合上下文语义信息的汉越平行短语对抽取方法

来源 :云南民族大学学报:自然科学版 | 被引量 : 0次 | 上传用户：hai198351

【摘要】

：

越南语是一种典型的资源稀缺型语言,汉越平行语料较为稀少,但在如维基百科、双语新闻等网站上存在大量的汉越可比语料.而从可比语料中抽取平行短语对任务能够有效缓解低资源

【作者】

：

杨舰高盛祥余正涛朱浩东文永华

【机构】

：

昆明理工大学信息工程与自动化学院,昆明理工大学云南省人工智能重点实验室

【出处】

：

云南民族大学学报:自然科学版

【发表日期】

：

2021年3期

【关键词】

：

上下文语义信息半监督自编码器平行短语对抽取汉-越可比语料

【基金项目】

：

云南省重大科技专项计划(202002AD080001),云南省基础研究计划(202001AS070014,2018FB104),国家自然科学基金(61761026,61972186,61732005,61762056),国家重点研发计划(2019QY1802,2019QY1801,2019QY1800),云南高科技人才项目(201606)。

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

越南语是一种典型的资源稀缺型语言,汉越平行语料较为稀少,但在如维基百科、双语新闻等网站上存在大量的汉越可比语料.而从可比语料中抽取平行短语对任务能够有效缓解低资源机器翻译中面临的数据稀疏性问题.考虑到上下文语义信息对抽取高质量的双语短语对有重要支撑.提出了融合上下文语义信息的汉越平行短语对抽取方法.首先使用汉、越单语语料训练汉、越向量矩阵;然后预训练编码器,通过注意力机制将句子编码信息和短语编码信息进行结合,生成含有上下文语义信息的单语短语向量,同时将平行短语对作为约束,使汉越短语向量在语义空间中距离最小

其他文献

页岩气水平井套管的剪压变形试验与套变预防实践

在我国页岩气勘探开发取得快速发展的同时,也伴随着页岩气水平井套管变形(以下简称套变)问题的频发,直接影响到了页岩气开发的效率和效益。为了探索预测、防范与治理套变的方

期刊

页岩气水平井套管变形地质力学套管变形防治暂堵裂缝长段多簇压裂工艺现场试验

论植保技术在果蔬种植管理中的重要作用

摘要：基于植保技术应用于果蔬种植管理的现状和問题，从绿色防治、防控病虫害、优化作物生长环境、提高生产效能以及产量质量5个方面阐述了植保技术在果蔬种植管理中的作用。　　关键词：植保技术;果蔬种植;病虫害　　文章编号： 1005-2690（2021）10-0092-02 中国图书分类号： S436.3 文献标志码： B　　随着社会发展和技术进步，人们对于果蔬质量提出了更高的要求，这对果

期刊

植保技术果蔬种植病虫害

浅析方家山机组主泵顶轴油泵电源设计不足及改进

文章介绍了方家山机组主泵顶轴油泵的功能、顶轴油泵供电电源的设计不足以及改进。通过电源改造,顶轴油泵运行增加了可靠性。在失去外电网导致主泵停运,顶轴油泵仍然可以保持

期刊

顶轴油泵推力瓦设计不足改进

高校学生实验工作倦怠感现状调查

摘要：为了解高校学生在高校实验室完成实验工作时的实验工作倦怠感现状，为帮助高校学生顺利完成实验工作提供参考，本文通过便利抽样方法，对259人进行问卷调查。调查发现，高校学生的实验工作倦怠感为轻度倦怠。多元线性分析表明：性别、年龄、专业、是否独立担任实验负责人、有无医院实习经验是影响高校学生实验工作倦怠感的主要因素（P<0.05）。高校学生对实验室的实验工作有一定的倦怠感，在实验工作中情绪尚佳，去

期刊

高校学生工作倦怠感现状调查

农田土壤阳离子交换量与理化性质的相关性探析

通过测定天津市3个地点的农田土壤阳离子交换量,进一步探寻土壤阳离子交换量与理化性质的相关关系。结果表明,土壤CEC值与有机质含量呈正相关关系,不同土壤质地对土壤养分的供应潜力是不同的。

期刊

农田土壤阳离子交换量理化性质相关性

基于RFID技术的图书馆自动化系统的应用拓展

文章根据RFID技术在图书馆的应用现状,分析了在图书馆使用中出现的问题,结合图书馆自动化系统的实际,探讨了图书馆自动化系统应根据RFID技术在图书馆的应用场景,相应拓展功能

期刊

RFID技术图书馆自动化系统应用

生态林业建设中育苗技术的应用探析

摘要：林业建设在改善生态环境、落实经济可持续发展中发挥着重要的作用，必须予以充分重视。育苗技术的科学化应用，可以避免幼苗纤细和树根稀疏等问题，大大提升幼苗的成活率，对推动生态林业建设意义重大。对生态林业建设的重要性与林木育苗技术的原则作了简要的分析，从硬枝扦插、嫩枝扦插、容器育苗、露地小苗移栽4个方面分析了生态林业建设中的育苗技术，提出了强化林木育苗技术应用效果的有效方法。　　关键词：生态林业

期刊

生态林业育苗技术应用

一款32~38 GHz毫米波宽带低噪声放大器的仿真设计

毫米波电子系统在雷达与卫星通信、电子对抗、遥测遥感、航天测控等通信接收系统领域有着广泛的应用。其中,低噪声放大器(Low Noise Amplifier,LNA)作为毫米波通信系统前端接

期刊

毫米波低噪声放大器带宽收发机

融合上下文语义信息的汉越平行短语对抽取方法

其他学术论文