论文部分内容阅读
针对现有室内场景识别方法仅通过关注视觉信息本身,而缺乏考虑图像中所含语义内容,提出一种基于长短期记忆神经网络和卷积神经网络的融合深度神经网络室内场景识别方法.首先使用labelImg工具为Visual Genome数据集图像生成位置描述符,经数据预处理算法处理后通过GloVe模型得到词向量.然后引入带有L2正则化的小批量梯度下降算法训练模型,将注意力机制与融合深度神经网络模型结合实现对位置描述符进行特征提取.最后通过Softmax函数进行场景分类.该文方法在所选Visual Genome数据集上取得