【摘 要】
:
图像描述任务是一种重要的现代智能图像应用技术,它利用精炼而又准确的自然语句对图像内容进行的概括性描述,非常广泛的被研究,融合了“计算机视觉(Computer Vision,CV)”和“自然语言处理(Natural Language Processing,NLP)”的人工智能领域。尤其对于视力缺陷人群在互联网上进行交流、儿童早期教育、智能人机交互以及机器人研究开发中有着非常大的应用前景。随着迅速进步
论文部分内容阅读
图像描述任务是一种重要的现代智能图像应用技术,它利用精炼而又准确的自然语句对图像内容进行的概括性描述,非常广泛的被研究,融合了“计算机视觉(Computer Vision,CV)”和“自然语言处理(Natural Language Processing,NLP)”的人工智能领域。尤其对于视力缺陷人群在互联网上进行交流、儿童早期教育、智能人机交互以及机器人研究开发中有着非常大的应用前景。随着迅速进步和发展的深度学习,基于深度学习的编码器-解码器(Encoder-Decoder)框架在图像描述任务中取得了非常显著的成果。在Encoder阶段,该方法利用深度卷积神经网络(Convolutional Neural Network,CNN)提取图像特征,在Decoder阶段,利用循环神经网络(Recurrent Neural Network,RNN)生成图像文本描述,并在图像描述任务中取得了较好的成绩。但是现有方法中仍然会存在生成的图像文本描述语句与图像自身内容的相关匹配度不高,并且在复杂场景中降低了图像描述模型的准确率等问题。因此,针对以上问题,本论文展开探究,主要进行了如下内容的研究:(1)本论文探究神经图像描述(Neural Image Caption,NIC)模型,在Encoder-Decoder框架的基础上,通过引用注意力机制对图像描述任务进行研究,并且从图像特征提取和语言生成两个部分进行处理。深入理解Vgg-19网络的模型结构,在Encoder阶段的图像特征提取上利用Vgg-19提取图像特征向量,在每个时刻应用注意力机制计算每个图像区域的权重,并且引用注意力机制网络优化Vgg-19提取到的图像特征向量,以此忽略掉一些不重要或者无关的图像信息,使得生成的图像文本描述语句具有更加流畅和丰富的内容。(2)在Decoder阶段的语言模型中,探究使用长短期记忆网络(Long Short Term Memory Network,LSTM)优化图像描述中的文本处理部分,通过使用LSTM中的门结构可以有效地改善语言生成模型中使用具有长期依赖、梯度消失或者爆炸问题的普通RNN模型,并且利用注意力机制过滤掉无关或者误导的注意力信息,解码时充分利用上下文信息生成对图像更为准确的描述语句。(3)在MSCOCO数据集上进行实验,采用BLEU-1,BLEU-4,METEOR和CIDEr的评价指标对模型结果进行验证,并且和其他一些经典的图像描述模型得分进行比较。结果表明,在大多数评价指标上本文所提图像描述模型得到了有效的提升。
其他文献
互联网时代的崛起,加速了物联网的发展。在物联网的发展下,为了解决日常交通状况拥堵的现状,车载自组织网络技术(Vehicular Ad Hoc Network,VANET)成为研究的重点技术。车载自组织网络技术也叫做车联网技术,它为智能交通系统(Intelligent Transportation System,ITS)的发展奠定了基础。目前车联网技术作为当前汽车产业研究的重点技术,是智能交通系统的
生物神经系统是由大量高度内联的神经元组成的,神经元在信息处理及传递的过程中扮演着重要的角色。而神经科学则是以神经元模型作为研究对象,对神经系统的放电活动进行研究。神经元模型的放电活动实质上就是神经系统细胞内电生理活动的重现。在实际生活中,神经元的异常放电会导致生物有机体病理变化。因此,研究神经系统的放电活动、控制神经系统达到稳定放电,具有一定的理论参考价值。本文基于一类改进神经元模型,利用非线性动
随着社会发展的进程,高速铁路需进一步提升安全性、舒适性和平顺性。由于我国幅员辽阔,高速铁路横跨东西南北,测区范围大、线路长,在途经地势复杂区域时,线路具有转折大、高差大等特点。为控制大高差线路的投影长度变形不超过10mm/km:首先,本文论述了研究背景、研究目标,以及控制投影长度变形方法的国内外研究现状。阐述了高斯投影及高斯投影正解的实数和非迭代复变函数表示。研究了高斯投影长度变形的主要影响因素,
接触网是专门为电气化铁路输送电力的特殊供电系统,其供电的稳定性直接影响列车的运行状态。而吊弦是链形悬挂接触网中承力索和接触线之间的重要连接部件,起着调节接触线高度和驰度并承载一定力的作用,其状态的好坏直接影响接触网悬挂系统的稳定性。吊弦一旦发生故障可能造成接触线高度下滑影响列车受流质量,严重时甚至引发弓网事故,危及列车行车安全。但目前有关接触网零部件缺陷检测识别的研究主要集中在支持定位装置区域,有
近年来,城市交通拥堵问题日益突出,城市轨道交通建设被视为有效解决问题途径之一,担任着越来越重要的角色。基于通信的列车运行控制系统(Communication Based Train Control,CBTC),作为我国现代化城市轨道交通最核心的技术之一,对于提高列车通过能力,保证列车运行安全都起到了重要作用。CBTC系统在投入使用前,必然要进行工程测试,目前各CBTC系统生产厂家在工程测试阶段使用
近年来我国铁路事业不断发展,在运输运营方面作用不可忽视,确保列车的运营安全成为重要课题。目前,我国对于时速超过250km/h的铁路采用的都是CTCS-3(China Train Control System level 3)级列车运行控制系统,也是高铁上运用最多的列车运行控制系统。对于CTCS-3级列车运行控制系统来说,它的核心设备是车载设备,承担着列车运行的主要控制功能,车载设备一旦出现故障会对
自动驾驶技术可有效解决社会面临的交通安全、道路拥堵、能源消耗等问题,以提供更舒适的交通环境。早期的自动驾驶技术主要研究特定场景下的驾驶任务,而在目前的城市交通中自动驾驶系统需要满足L3以上的功能。自动驾驶汽车在各种交通环境下的安全性评估是目前的研究热点和持续被关注的问题。其难点在于不同交通场景的分类、大量时空数据的计算、攻击者恶意攻击的预防、以及各种人工驾驶和自动驾驶混合交通造成的环境不确定性和复