论文部分内容阅读
针对基于卷积神经网络(convolutional neural network,CNN)和长短期记忆网络(long short-term memory,LSTM)的方法存在计算复杂度高、收敛速度慢、训练时间长等问题,本文提出基于GoogLeNet和双层GRU的图像描述模型,在训练阶段采用适应性动量估计法(adaptive moment estimation, Adam)优化算法,加快了整体模型的收敛速率,提高了模型性能。在MSCOCO和Flickr30K两个数据集上的实验结果表明,基于GoogLeN