基于深度学习的图像描述生成方法研究

来源 :齐鲁工业大学 | 被引量 : 1次 | 上传用户:xlinda
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
社会的快速进步极大地激发了智能技术的创新发展。图像特征提取技术和文本自动生成技术都受到学术界的极大关注。近年来交叉学科和跨领域的研究受到巨大的青睐,尤其是融合图像和文本的深度学习研究,即图像描述生成技术。它是一个涉及自然语言处理和计算机视觉的综合性研究问题。本文详细介绍了图像描述生成技术的研究背景、国内外研究现状。并从多个角度和方向对常用的图像描述生成模型进行了分析研究。具体研究内容如下:(1)针对图像描述的广度和非相关性问题,设计了一种基于多级注意力的细粒度图像描述生成方法,以增强特定区域的图像描述。首先,利用视觉注意力机制融合图像全局和局部的细粒度特征。其次,利用联合注意力机制融合图像的视觉特征和标签特征,生成图像特定区域的描述文本。最后,使用基于注意力的长时短期记忆网络(LSTM)的语言生成模型来生成细粒度的图像描述语句。实验证明,该方法能有效地提高图像描述语句的针对性和准确性。(2)针对以往图像描述生成模型忽略文本信息特征的问题,设计了一种融合多角度多模态的图像描述生成方法。首先,该模型利用全局图像和局部图像的特征、利用基本的编解码模型生成图像的第一句描述作为输入;其次,利用句子编码网络将第一句输入生成文本语义特征向量;最后,利用注意力机制和文本语义特征向量融合图像特征,将其输入到基于注意力的语言生成模型中,以便生成下一句;以此类推,直到到达设置的语句上限。实验表明,该方法能够有效地利用多模态的特征信息生成多角度的图像描述语句。(3)在图像描述生成模型的训练过程中,生成图像描述语句的速度慢、效率低、时间成本高等问题,设计了一种基于Hadoop大数据平台的图像描述生成方法。该模型的设计是基于融合多角度多模态的图像描述生成方法的模型架构。它主要采用基于Map Reduce的分布式计算框架和基于HDFS的分布式存储系统,来处理大规模数据特征的问题。实验证明,该方法能有效加快图像描述生成模型的训练速度,极大地减少时间成本,提高了模型的效率和性能。
其他文献
本文详细阐述了工业园区动力系统建设项目的质量控制方法应用。以YF园区实际工程建设项目为案例,集中探讨在工程建设的决策、实施和运行三个阶段,如何运用质量控制方法对工程
我国是农业大国,农产品质量与安全是保障国民健康和经济社会发展的前提。农药在防治虫害,调节农作物生长方面起着重要的作用,但是盲目使用农药会造成农药残留超标等问题,对人
水稻是我国重要的粮食作物。水稻生产对我国粮食安全有着举足轻重的作用,同时水稻田也是重要的农业温室气体排放源。近年来我国南方双季稻种植面积大量减少,一方面来源于社会经济因素,另一方面与气候变化也有一定关系。因此为了评估气候变化和我国南方稻区复种变化双重背景下的稻田温室气体变化情况,本研究将南方双季稻主产区作为研究区域,首先基于水稻的农气观测数据,通过DSSAT模型中的GLUE模块,扩充完善了DNDC
早期抗震工程研究主要侧重于怎样减少巨大地震所造成的建筑物倒塌以及人员伤亡。随着地震工程研究的进展,除了保证三水准的结构设计目标外,地震造成的性能损失以及经济损失逐渐成为关注的热点。因此,有必要在既有建筑物地震易损性分析的基础上,研究地震损失的评价方法。本文将钢筋混凝土框架结构作为研究对象,对既有混凝土框架结构震后性能损失评价方法进行了深入研究,本文的主要研究工作如下:1、根据增量动力分析方法的基本
第五代移动通信系统(5th Generation Mobile Communication System,5G)的诞生极大地扩展了通信连接范畴。随着大规模机器类通信(massive Machine Type of Communications,mMT
社区教育自80年代在中国逐步推广开来,已经走过30多个年头。浙江省教育厅《关于推进学习型城市建设的实施意见》指出,要全面贯彻落实党的十八大和十八届三中、四中、五中全会
我国高速铁路雷击事故多有发生,并由此造成了不同程度的经济和人员损失。我国高速铁路建设中高架桥使用比例大,高架桥架设后导致雷电通道发展路径和落雷分布发生改变,进而影响接触网系统和其附近地面的雷击特性。接触网系统及其近地面的雷击特性对防雷设计有重要的指导作用,而现有研究在此方面存在一定的欠缺。因此,研究高架桥对接触网系统及其近地面雷击特性的影响具有重要的意义。论文围绕以下几个方面展开:基于分形理论,实
惯性粘滑驱动因具有运动速度快、定位精度高等优点,被广泛应用于跨尺度精密定位领域。在惯性粘滑驱动系统中,压电驱动电源输出驱动信号,驱动惯性粘滑平台进行快速运动和精密
随着工农业不断发展,大量的污染废水进入海洋,江河湖泊和水库之中,使得这些水体被严重污染,富营养化程度严重。水体中水华暴发的诱因之一就是因为水体中的富营养化程度越来越高。水华的发生破坏周围生态环境,使得水质变差,并影响到水域周围居民的生活。因此,需要一种监测设备来监控水体中的水质和周边气象状况,用以预测水华是否发生和水体中藻类浓度,进而保护水环境和预防水生态系统被破坏。本文围绕水华预警智能监测设备的
近年来,随着移动设备的普及和视频业务的兴起,人们在移动设备上进行视频观看的日常需求越来越多。频繁的设备连接和日益增长的网络规模加重了基站的负担,传统的蜂窝网络难以