一种基于注意力机制与多模态的图像描述方法

来源 :辽宁大学学报(自然科学版) | 被引量 : 4次 | 上传用户:xf198699
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
最近几年在深度学习领域中,自动生成一副图像的自然语言描述引发了学界的广泛关注,原因是图像描述在实际应用中的重要性以及它连接了两个重要的人工智能领域:计算机视觉和自然语言处理.以往的模型大多采用基于模板或简单的编码-解码方式,生成的文本结构较为单一并且不能够根据图像中各个物体的相互关系表达出图像的深层意义.提出了一种基于注意力机制与多模态的图像描述方法,在LSTM(Long-Short Term Memory)的基础上改进了Attention机制,并在Attention结构后面添加了多模态层对图像的上
其他文献
根据现场的实际情况,提出非进路调车电路分段解锁方案,提高作业效率,达到节能减排的良好效果。
云计算的出现为图书馆开展优质化的服务创造了有利条件,读者可以借助图书馆便捷化的设施,并利用先进的无线网络服务技术,在任何时间和地点,在云内获取海量的信息资源和服务,
<正> 一、工具书概念之检讨“工具书”一词。杨祖希先生以其不见于《四库全书总目》和《辞源》(修订本)等中国古代书目和古汉语辞典,推测它是一个外来词,是英文refrence book
利用模糊数学思想将坐标问题转变成空间所属区域问题,提出了一种无线传感器网络中新的定位算法——模糊三角形(FTL)算法,并使用NS2仿真系统对该算法的设计进行仿真实现和性能分
针对目前欠定盲源信号分离在源信号不充分稀疏的情况下分离精度较低的问题,提出一种基于压缩感知和优化算法的欠定盲源信号分离方法.首先分析了欠定盲源信号分离和压缩感知问
随着城乡居民生活水平的提高,为满足居民需求,山东德州地区设施蔬菜规模持续扩大,设施蔬菜产业成为德州市现代农业的重要组成部分。总结阐述了德州设施蔬菜产业发展现状及存
图的最短路径查询作为图论的经典问题,广泛应用于现实世界的许多应用中.然而随着图的规模日益增大,传统单机环境下的查询算法已无法满足大规模图的处理需求.为解决上述问题,