基于注意力机制的多层次编码和解码的图像描述模型

来源 :计算机应用 | 被引量 : 0次 | 上传用户:pjzh210427
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图像描述任务是图像理解的一个重要分支,它不仅要求能够正确识别图像的内容,还要求能够生成在语法和语义上正确的句子。传统的基于编码器-解码器的模型不能充分利用图像特征并且解码方式单一。针对这些问题,提出一种基于注意力机制的多层次编码和解码的图像描述模型。首先使用Faster R-CNN(Faster Region-based Convolutional Neural Network)提取图像特征,然后采用Transformer提取图像的3种高层次特征,并利用金字塔型的融合方式对特征进行有效融合,最后构建
其他文献
智慧农业是实现农业精准化的技术解决方案,智慧农业系统可以实时监测植物生长的各类环境参数,并可以应用相应的预测模型来模拟农作物生长环境的变化趋势,为科学决策提供依据。近年来有很多学者提出了时间序列的预测模型算法,在预测稳定性方面取得了不错的效果。为了进一步提升时间序列的预测精度,提出一种基于差分整合移动平均自回归模型和小波神经网络的组合预测模型。该组合模型结合2个单项模型优点,用差分整合移动平均自回归模型来拟合序列的线性部分,用小波神经网络来校正其残差,使其拟合曲线更接近于实际值,采用温室内的历史温度数据来
目前现有基于模型的推荐算法多是将评分数据输入到深度学习模型中进行训练,得出推荐结果。其缺陷在于无法对预测结果进行可解释性分析。除此之外,无法有效地解决算法的冷启动问题。因此,本文提出一种基于知识图谱和Bi-LSTM的推荐算法,来有效解决算法的可解释性和冷启动问题。首先将获取到的数据集进行预处理,生成预编码向量,根据数据集结点的连接性,构建专业领域知识图谱。其次利用知识图谱的元路径提取技术获取到多条用户-物品路径信息,将其输入到Bi-LSTM中,在路径经过的各结点处加入一层注意力机制,目的是为了模型能够有效
在自然语言处理(NLP)中,句法信息是完整句子中词汇与词汇之间的句法结构关系或者依存关系,是一种重要且有效的参考信息。语义解析任务是将自然语言语句直接转化成语义完整的、计算机可执行的语言。在以往的语义解析研究中,少有采用输入源的句法信息来提高端到端语义解析效率的工作。为了进一步提高端到端语义解析模型的准确率和效率,提出一种利用输入端句法依存关系信息来提高模型效率的语义解析方法。该方法的基本思路是先
针对卷积神经网络模型参数规模越来越大导致难以在计算与存储资源有限的嵌入式设备上大规模部署的问题,提出一种降低参数规模的卷积神经网络模型压缩方法。通过分析发现,卷积层参数量与输入输出特征图数量以及卷积核大小有关,而全连接层参数数量众多且难以大幅减少。通过分组卷积减少输入输出特征图数量,通过卷积拆分减小卷积核大小,同时采用全局平均池化层代替全连接层的方法来解决全连接层参数数量众多的问题。将上述方法应用于LeNet5和AlexNet进行实验,实验结果表明通过使用组合压缩方法对LeNet5模型进行最大压缩后,参数
技术体制符合性审查是信息系统立项时的一个重要环节,是对新立项系统在体系中的定位作用和标准符合性的一个有效评估,也是对项目风险控制的一种重要措施。而目前对于技术体制符合性审查验证通常以人工审查、专家经验判断为主,缺乏有效的技术支撑手段。本文研究以自然语言处理(NLP)为主要技术手段的技术体制审查方法,提出针对技术体制审查的NLP命名实体识别算法,并基于技术体制审查业务和审查算法,实现技术体制审查系统。
针对自然界中不同种类植物的叶片可能存在类间差异小而导致一些边缘轮廓相似的本土植物和外来入侵植物叶片识别错误的问题,提出一种PF-VGGNet模型。常用的VGGNet模型在图像分类上表现优秀,采用顺次连接的结构,可以很好地提取图像的高级语义信息特征,但一些图像浅层的轮廓和纹理特征也对分类起到关键作用。PF-VGGNet模型可以将浅层轮廓和纹理特征与网络深层高级语义信息融合,实现对植物叶片的自动识别。
针对极限学习机(ELM)中隐藏层到输出层存在误差的问题,通过分析发现误差来源于求解隐藏层输出矩阵H的Moore-Penrose广义逆矩阵H~?的过程,即矩阵H~?与单位矩阵有偏差,可根据偏差的程度来选择合适的输出矩阵H以获得较小的训练误差。根据广义逆矩阵和辅助矩阵的定义,首先确定了目标矩阵H~?H和误差指标L21范数,其次通过实验分析表明H~?H的L21范数与ELM的误差呈显著线性相关,最后通过引
针对已有差分隐私高维数据发布方法无法有效兼顾数据间复杂属性的关联关系和计算成本的问题,提出一种基于聚类分析技术的差分隐私高维数据发布方法 PrivBC。首先,基于K-means++设计属性聚类方法,引入最大信息系数量化属性间的关联关系,并对具有高度关联关系的数据属性进行聚类。其次,对聚类产生的各个数据子集进行如下操作:计算关系矩阵以缩减属性对的候选空间,并构建满足差分隐私的贝叶斯网络。最后,根据贝
在实际生活中,可以很容易地获得大量系统数据样本,却只能获得很小一部分的准确标签。为了获得更好的分类学习模型,引入半监督学习的处理方式,对基于未标注数据强化集成多样性(UDEED)算法进行改进,提出了UDEED~+——一种基于权值多样性的半监督分类算法。UDEED+主要的思路是在基学习器对未标注数据的预测分歧的基础上提出权值多样性损失,通过引入基学习器权值的余弦相似度来表示基学习器之间的分歧,并且从
信用风险是商业银行所面临的主要金融风险之一,而传统的基于统计学习的信用评分方法不能有效利用现有的特征学习方法,因此预测准确度不高。为解决这个问题,提出一种增强多维多粒度级联森林的方法建立信用评分模型,借鉴残差学习的思想,建立了多维多粒度级联残差森林(grc Forest)模型,从而大幅增加提取的特征。除此之外,使用多维多粒度的扫描尽可能多地提取原始数据的特征,从而提高了特征提取的效率。对各模型的实