一种基于注意力机制与多模态的图像描述方法 - 开源共享论文下载平台 - 信丰网

一种基于注意力机制与多模态的图像描述方法

来源 :辽宁大学学报(自然科学版) | 被引量 : 4次 | 上传用户：xf198699

【摘要】

：

最近几年在深度学习领域中,自动生成一副图像的自然语言描述引发了学界的广泛关注,原因是图像描述在实际应用中的重要性以及它连接了两个重要的人工智能领域:计算机视觉和自然语言处理.以往的模型大多采用基于模板或简单的编码-解码方式,生成的文本结构较为单一并且不能够根据图像中各个物体的相互关系表达出图像的深层意义.提出了一种基于注意力机制与多模态的图像描述方法,在LSTM(Long-Short Term M

【作者】

：

牛斌李金泽房超马利徐和然纪兴海

【机构】

：

辽宁大学信息学院,渤海大学信息学院,中国人民解放军65735部队

【出处】

：

辽宁大学学报(自然科学版)

【发表日期】

：

2019年01期

【关键词】

：

图像描述注意力机制 LSTM 多模态 image descriptionattentionLSTMmultimodality

【基金项目】

：

辽宁省科技厅博士科研启动基金指导计划项目(20170520276)

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

最近几年在深度学习领域中,自动生成一副图像的自然语言描述引发了学界的广泛关注,原因是图像描述在实际应用中的重要性以及它连接了两个重要的人工智能领域:计算机视觉和自然语言处理.以往的模型大多采用基于模板或简单的编码-解码方式,生成的文本结构较为单一并且不能够根据图像中各个物体的相互关系表达出图像的深层意义.提出了一种基于注意力机制与多模态的图像描述方法,在LSTM(Long-Short Term Memory)的基础上改进了Attention机制,并在Attention结构后面添加了多模态层对图像的上

其他文献

分段解锁的非进路调车电路

根据现场的实际情况,提出非进路调车电路分段解锁方案,提高作业效率,达到节能减排的良好效果。

期刊

分段解锁非进路调车进路

试论云计算对高校图书馆建设的影响

云计算的出现为图书馆开展优质化的服务创造了有利条件,读者可以借助图书馆便捷化的设施,并利用先进的无线网络服务技术,在任何时间和地点,在云内获取海量的信息资源和服务,

期刊

图书馆无线信息网络数字信息资源

工具书概念新探

<正> 一、工具书概念之检讨“工具书”一词。杨祖希先生以其不见于《四库全书总目》和《辞源》(修订本)等中国古代书目和古汉语辞典,推测它是一个外来词,是英文refrence book

期刊

工具书概念

无线传感器网络中FTL定位算法的设计与仿真实现

利用模糊数学思想将坐标问题转变成空间所属区域问题,提出了一种无线传感器网络中新的定位算法——模糊三角形（FTL）算法,并使用NS2仿真系统对该算法的设计进行仿真实现和性能分

期刊

无线传感器网络定位算法FTLwireless sensor networkslocalization algorithmFTL

基于压缩感知和优化算法的欠定盲源信号分离

针对目前欠定盲源信号分离在源信号不充分稀疏的情况下分离精度较低的问题,提出一种基于压缩感知和优化算法的欠定盲源信号分离方法.首先分析了欠定盲源信号分离和压缩感知问

期刊

欠定盲源信号分离压缩感知优化算法稀疏性Underdetermined blind source separation Compressed sensin

德州地区设施蔬菜产业发展现状与对策建议

随着城乡居民生活水平的提高,为满足居民需求,山东德州地区设施蔬菜规模持续扩大,设施蔬菜产业成为德州市现代农业的重要组成部分。总结阐述了德州设施蔬菜产业发展现状及存

期刊

设施蔬菜产业山东德州发展现状及存在问题现代农业德州地区发展对策和建议居民需求发展现状与对策

一种基于Hadoop的大规模图最短路径查询方法

图的最短路径查询作为图论的经典问题,广泛应用于现实世界的许多应用中.然而随着图的规模日益增大,传统单机环境下的查询算法已无法满足大规模图的处理需求.为解决上述问题,

期刊

HADOOPMAPREDUCE图分割最短路径分布式Hadoop MapReduce graph partition shortest path dis

与本文相关的学术论文