基于深度学习的图像描述生成算法研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:idcxinrui
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图像描述生成作为计算机视觉领域与自然语言处理领域的交叉部分,在图像检索、场景理解等众多方向都有着广阔的发展空间。获取图像中的目标以及它们之间的关系,并使用自然流畅的语言对其进行描述,是图像描述生成任务所要解决的问题。近年来,随着深度学习的兴起,图像描述生成领域快速发展。生成的图像描述越来越准确,同时描述的风格趋向于多样化。本文针对图像描述生成问题展开了研究,总结了图像描述生成领域的发展现状,并提出了几种基于编码器-解码器架构的图像描述生成方法,主要工作如下:(1)基于三层LSTMs(Triple LSTMs,Tri-LSTMs)模型的图像描述生成方法。当前大多算法生成的图像描述过于粗糙,不能对图像中的细节进行描述。为了解决这一问题,首先构建了包含级联注意力机制的Tri-LSTMs模型。该模型同时利用语义属性与图像特征指导图像描述的生成,有效地提升了指导信息的丰富性。随后设计了基于双向间隔损失函数的图文检索模型,用于监督Tri-LSTMs模型的训练。对于TriLSTMs模型所生成的文本,该图文检索模型可以计算匹配的图像-文本对的匹配度与不匹配的图像-文本对的匹配度。通过将其将其反馈给图像描述生成模型,可以生成更具区分性的图像描述。该方法在保证图像描述准确性的同时,可以更多地关注图像中的细节。(2)基于双层前文LSTMs(Double Preface LSTMs,DP-LSTMs)模型的图像描述生成方法。针对编码器-解码器架构中,解码器对序列的长期依赖关系建模不足的问题,引入双层的前文注意力机制。在每一个时刻,为序列前面所有时刻的解码器状态分配权重。与当前时刻关联性越大的状态获得越大的权重,从而对当前时刻产生更大的影响。通过这种策略,解码器不再仅仅依赖于前一个时刻的状态,从而有效地增强了序列的长期依赖,避免序列过长时导致的信息丢失问题,提升了生成的图像描述的质量。(3)基于三重语义属性LSTMs(Triple Semantic LSTMs,TS-LSTMs)模型的遥感图像描述生成方法。首先建立语义属性库,并使用多分类器为遥感图像预测每个语义属性在该图像中出现的概率。挑选出与图像相关性最强的若干语义属性,即出现概率最大的若干语义属性。提取这些语义属性的词向量表示,并将其输入到解码器的输入层、输出层等位置,作为指导信息参与图像描述的生成。该算法在多个遥感图像描述数据集上均生成了准确的描述,在多个指标领先于当前的遥感图像描述生成方法。
其他文献
能源领域企业国家重点实验室作为能源应用技术研究的重要基地,是我国能源技术创新,推动能源革命的主要科技力量。能源产业具有投资大、关联多、周期长、惯性强的特点,使用同一套绩效评价指标对所有领域的企业国家重点实验室进行绩效评估不利于能源技术体系的长期规划。因此,构建一套符合能源领域企业国家重点实验室的绩效评估指标体系十分必要。科研基地不同于纯粹的营利性组织,对于其绩效的考核更加重视组织完成战略目标的情况
Fe3O4胶体纳米粒具有超顺磁性、比表面积大等优点使其在物质分离、靶向药物输送、传感器、催化等领域具有良好的应用前景。但由于其表面能较高,很容易发生团聚,这在一定程度
外周中心静脉导管(PICC)是经外周静脉送入中心静脉的导管,适应于需要长期静脉输液、化疗、胃肠外营养的病人及早产儿。因有效保护外周静脉,避免静脉炎的发生,提高病人的生活
会议
随着移动通信技术与应用的迅猛发展,社会违法分子利用手机电话、短信等通讯手段进行电信诈骗,已经成了危害用户安全的一大问题;虚假放号是电信代理商出于盈利目的,私自激活号码并将号码伪装成正在使用状态的行为,给运营商带来了营销成本的浪费,工作效率的降低和管理难度的增加。因此,对虚假放号和电信诈骗的检测技术的研究具有重要的意义。本文的研究内容是通过对电信用户数据分析与挖掘,运用机器学习、神经网络等工具,构建
随着互联网和电子商务的高速发展,我国快递业务量和服务质量都在稳步提升。各家快递企业根据自身业务需求,自建配送网络,造成了城市快递网点分布不均衡、网络结构不合理和土地资源浪费等问题。共同配送模式在日本等发达国家已经广泛推行,多家快递企业共用配送网络,可以合理配置城市物流资源,减少快递网点数量,提高土地、车辆和人力等资源的利用效率。我国城市共同配送发展还不均衡,深入研究城市快递网络,对于城市发展和快递
黔江区位于重庆市东南部,地处武陵山区腹地,有“渝鄂咽喉”之称,集革命老区、民族地区、边远山区和国家扶贫开发工作重点县于一体,处于我国14个集中连片特困地区武陵山区,2011年国务院发布的《中国农村扶贫开发纲要(2011-2020年)》指出,集中连片特困地区作为扶贫攻坚主战场是我国新阶段扶贫开发工作的重中之重,2020年中国要实习全面建成小康社会的奋斗目标,难点在连片特困地区。该区经济基础差、底子薄
目前银行业所处的内外部环境发生了显著的变化,由于金融科技的发展、互联网银行兴起和影子银行的出现,目前现行市场上银行盈利模式痛点日益暴露,导致经营日益困难,竞争力日益退化,在目前经营日益激烈的环境中,银行继续开辟一条属于自己发展的路径,不断提高现有市场份额与竞争力,向多元化盈利模式方向转变。基于这样的背景,本文以X银行为例,探索智能化经营下增加银行利润的途径有哪些,从而使商业银行在数字科技日益发达的
在移动互联网技术高速发展的背景下,共享经济得以产生并蓬勃发展。现阶段共享经济已经成为了创新经济的主流,并以价值共创和协同分享作为理念,促使顾客形成了个性化消费、适
大多数富营养水域都存在被新型环境污染物纳米粒子污染的风险,随着养殖水体的富营养化,这通常导致浮游动物、纳米粒子、蓝藻和绿藻同时存在同一养殖水域中。浮游植物作为生态
中国钢铁工业一直蓬勃发展,规模空前,钢铁产量居世界第一。风光背后,也存在着钢铁产能过剩、生产技术落后、产品附加值低、环保不合格等诸多问题。近些年国内制造业遭遇严冬,钢铁业也遭受重创,加之国内雾霾治理日趋严厉,钢铁行业展开了新一轮的资源整合。本文将以BS公司并购WH公司的案例为研究对象,分析并购的动因和影响,并得出个人的建议和结论。本文第一章阐述了论文的研究背景、内容和意义,回顾和评价了国内外的并购