基于卷积循环网络一体化训练的图像描述方法研究

来源 :北京工业大学 | 被引量 : 0次 | 上传用户:jakey17866747
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图像描述任务就是对输入图像生成相应的文字描述,它有利于人们对不同的视觉场景进行更好的理解。该任务在人工智能领域内备受关注,在无人驾驶、军事安全等方面有着重要意义。本文针对目前图像描述任务所用到的方法进行了研究,并在现有方法的基础上提出一体化训练的方法来提升图像描述的效果,主要研究工作和创新点如下:1.对图像描述数据集完成了图像预处理与图像特征提取的工作。在预处理方面,本文对数据集中所有的图像数据进行了筛选处理工作,把原始图像中不符合要求的损坏图、灰度图、多通道图分别进行了相应的删除与转化处理。在图像特征提取方面本文使用了卷积神经网络,并且使用了迁移学习的方法把预先训练的参数迁移到本文的卷积神经网络中,并根据现有数据集对网络参数进行调整,用来提升特征提取的速度,改善特征提取的效果。2.对图像描述数据集完成了文本预处理工作。本文对文本进行了预处理操作主要是把文本进行单词分割并对其中的关键词进行提取,并选择相应频率较高的单词进行向量转换。本文使用了长短时记忆网络根据图像与文本之间的关系进行训练。3.本文介绍了目前现有的分开训练的松散模型,并在该模型的基础上提出了卷积神经网络与长短时记忆网络联合一体化训练的联合模型。通过对松散模型与联合模型的介绍与分析,说明了联合模型的优势,并对其核心的一体化训练方法进行了详细介绍。为了保持结构一体化本文选用TensorFlow框架完成联合模型的构建。正向传播过程中利用卷积神经网络对图像进行特征提取,并把提取后的图像特征用于长短时记忆网络隐含层的初始化,同时把文本向量作为长短时记忆网络的输入,从而使图像与文本产生关联。在训练的反向传播过程中,根据最终损失值同时对两个网络的参数进行更新,完成一体化训练,实现图像作为输入文本描述作为输出的端到端的生成方法。本文选择利用分开训练的松散模型和一体化训练的联合模型进行实验对比。实验结果证明,本文提出的一体化训练方法,实现了端到端的方法使得训练操作过程得到简化,而且通过BLEU得分的数据分析得出联合模型的得分相对于松散模型得分提高了18.08%左右,而且可视化得分分布明显优于松散模型。对比结果说明本文提出的一体化训练的联合模型的图像描述效果要优于分开训练的松散模型。
其他文献
以创业板上市公司为样本,实证检验了国际化经营对股价崩盘风险的影响及创始人CEO所产生的调节作用。研究发现:国际化经营与创业板上市公司股价崩盘风险之间存在显著的负相关
目的耳鼻喉术后疼痛患者应用综合护理在预防疼痛护理中的临床效果。方法选取2016年1月至2017年10月期间,我院进行耳鼻喉手术治疗的80例患者,进行随机数字抽样法进行分组研究,
探讨了南亚佛教古迹中所体现的宇宙观是如何映射到黄河流域的本土建筑传统之中的。佛教东传之时,南亚祭坛和神庙的象征形式并未直接移植到这一新的文化环境之中,而是被转译成
<正>日前,河北省环保厅印发《河北省重点行业秋冬季差异化错峰生产绩效评价指导意见》提出,对重点行业开展秋冬季差异化错峰生产绩效评价,科学制定差别化停限产措施,严禁"一
会议
据报道,面部激素依赖性皮炎的发生率逐年增加。表现为皮炎并对激素有依赖性,停药后皮损加重【lI目。主要与外用激素使用不当、滥用护肤品有关,尤其以中青年女性患者使用美白、祛
古希腊诸邦中无论是军政大事还是普通民众的日常生活都与神祗息息相关,随着公元前5世纪社会经济和哲学思想的发展,希腊神祗观念也发生了显著的变化,甚至出现了新旧两种观念的
一、引言中国图案有着悠久的历史和优秀的传统。古代图案在工艺美术的发展史上具有重要的地位,在它多种多样的形式中,差不多可以找到以后各种图案形式的胚胎和萌芽。没有古
阅读教学是中学生语文教学中的一个重要环节,一直以来受到各界专家学者的高度重视。中学生通过阅读各种文本可以提升他们的语文综合素养,但是现阶段中学生在阅读教学中并没有
地震文学是文学样式中一个独特的类别,它以历史事件的见证者、历史灾难的反抗者的身份,展现出特定紧张状态下的世态景象,成为反映灾难最为灵敏的感应器,成为文学中能展示自然
最近,汽修厂失火事件不绝于耳,火源无独有偶都发生在烤漆房,这纯属巧合还是事出有因?且不论发生起火事件危害有多大。其直接的经济损失就相当可观。由于汽修厂通常停放部分待修车