基于Image_Caption的车厢场景自适应描述

来源 :交通科技与管理 | 被引量 : 0次 | 上传用户:evemxy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘 要:图像自适应描述(Image_Captioning),是指以图像为输入,通过模型和计算来输出对应图像的自然语言描述。这一领域是结合了人工智能两大方向:计算机视觉和自然语言处理。将图像自适应描述算法应用于地铁车厢内部情况检测,有利于车站管理人员迅速全面掌控车厢内部情况,快速应对车厢内部突发情况。有利于提示车厢内部乘客互相照顾,提高车厢内部优质资源分配合理性(如残疾人以及孕妇让座)。
  关键词:图像自适应描述;人工智能;车厢
  1 图像自适应描述算法
  Image Caption(图片描述)模型中,以图片数据作为输入,经过CNN进行卷积提取图片特征信息最终形成图片的特征图信息,而后attention模块对提取的特征图进行加强与抑制,作为后续进入LSTM模型的输入数据,不同时刻的attention数据会受到上一时刻LSTM模型输出数据而有所调整,LSTM模型最终输出文本信息。
  2 模型细节
  2.1 encoder模块
  Image Caption(图片描述)模型的最终输出为一个长度为C的句子,其中yi指句子中的第i个词,这个词属于一个k维实数的词向量,其中K是字典长度。在encoder阶段,文中使用的是CNN(卷积神经网络),用于提取特征图向量集合,这些特征图向量后续会被作为注释向量。
  通过CNN会提取L个特征图向量,命名为a,每一个都是D维向量用来代表图片的一部分。同时为了保留特征图与2维图片的关系,本文中的特征来自于较浅的卷积层,由此保证后续的decoder阶段,能够通过选取所有特征图的子集而选择性聚焦到图片的部分位置。
  2.2 decoder模块
  在decoder阶段模型使用的是 long short-term memory (LSTM,长短时记忆模型)network,图片的说明文字由本模型生成,在预测每一个词的时候都会需要使用背景向量、前一時刻的隐藏层向量、前一时刻的词向量。
  decoder节段是一个标准的LSTM过程,每个LSTM需要以下输入:
  (1)背景变量Z,来源于图片经过CNN提取特征后,再使用attention进行过滤后的向量。(2)前一时刻的隐藏层向量h。(3)前一时刻的词向量E,此时的词被转化为embeding向量。
  2.3 背景向量Z的计算
  背景向量Z的含义,Z是在t时刻,输入图片数据的动态表达,Z是基于输入图片数据的,后续的加工依赖于注释向量a。随着时间的不同,Z向量随前一时刻输出的y而变化。
  (1)通过att函数计算第i张特征图ai与上一时刻隐藏向量ht-1的关系eti。
  (2)使用归一化,将eti转化为概率值,成为attention系数αti,αt既是指t时刻attention的集合。
  (3)特征图集合a中元素分别于attention系数中αti计算得到t时刻背景向量 。
  3 attention机制--hard attention
  计算特征图与隐藏向量间关系时用到了att函数(hard attention ),hard attention是使用一种随机的方法计算attention系数α。首先先设定一个t时刻的位置变量st,st是指在t时刻生成词的时候模型需要聚焦于图片的哪些位置。在hard-attention 模型中,st是一个one-hot编码向量,st,i中最大的值为1,其余均为0。该模型会把与生成下一个词最相关的特征图提取出来并将其他特征图抛弃。
  4 损失函数
  
  5 实验与分析
   (1)实验环境:Cpu:E5-2630L v3 内存:64g Gpu:NVIDIA GeForce 3090。
   (2)训练数据为flickr8k数据集。
   (3)网络构建及训练:本次实验特征提取模型采用densenet121,epoches设置为2 000,encoder_learning_rates设置为1e-4,decoder_learning_rate设置为4e-4。
  (4)测试结果:
  经过2 000轮的训练后,使用轨道车厢内部图片对模型进行验证。识别描述的准确率在80%以上。
  6 结束语
  经过研究后发现image_captioning算法在地铁车厢这一场景,可以对乘客行为进行较为合理的描述,在轨道车厢内部安防领域具有较大前景,具有智能度高,易推广等优点,极具开发潜力。
其他文献
摘 要:西安作为我国西部地区的重要核心城市,是我国科研、教育、工业发展的重要基地。随着社会的快速发展,地铁作为西安的轨道交通工程中的重要组成部分,已经对西安的发展起到了重要的作用,是人们出行的必由之路,所以地铁车辆的检修与维护工作是保障地铁正常运行的关键所在。随着交通线路的增加和覆盖面积的变广,地铁车辆的检修和维护工作遇到了新的挑战和机遇,如何降低检修成本、加强维护效果、延长车辆寿命、提高安全性能
期刊
摘 要:新能源汽车的开发是全球的趋势,各个国家都在为新能源汽车的开发提供这政策和经济技术支持。新能源汽车电子控制的关键性技术研究,更是各个国家的重点研究和提高的对象之一。只有不断的坚持技术研究才能研发出更新型的新能源汽车为人民谋福利。  关键词:新能源;电子控制技术研究;汽车;技术研究  0 引言   全球变暖问题的日益加重,各个国家都出台了相应的管控措施,让全球化变暖速度降低下来,保护生存环境
期刊
摘 要:城市轨道交通的扩张性发展,也对线路、车辆的维修保障工作提出了更高要求,传统人工检测、大型故障车检测的方式在新的挑战面前面临着诸多问题。结合主流技术的应用情况,根据新技术发展的状况,描述了车载检测技术的构成,阐述了其现阶段实际应用的优势。进一步展望了车载检测技术的发展前景,努力为轨道交通的安全运营提供更有效、高效的解决方案。  关键词:城市轨道交通;检测设备;正线监测  0 前言   城市
期刊
摘 要:本文介绍了整车控制器的功能作用,并建立在现有整车控制器的基础上进行改进设计,对改进后整车控制器在新能源汽车上的应用进行研究分析。  关键词:新能源汽车;整车控制器;设计;应用  0 引言  随着新能源汽车的普及推广,因其环保、低成本、驾驶体验好等受到人们的青睐。但是在发展过程中,新能源汽车容易受到的干扰因素也同样不容忽视,为提高用户驾驶体验,本文将对整车控制器的应用技术进行研究分析,并通过
期刊
摘 要:为了提升冰雪天气下沥青路面的行车安全,本文总结了沥青路面的结冰监测技术和预警技术在国内外研究的进展,并对不同技术的特点进行了比较。  关键词:沥青路面;结冰监测;结冰预警  0 引言  我国四分之三的国土属于冬季积雪地区,有些地区积雪期长达3~4个月。降雪、结冰将直接导致路面防滑性能的下降,导致汽车刹车失灵、方向失控,从而易引发交通事故。相关资料表明,干燥沥青路面的附着系数约为0.6,而积
期刊
摘 要:当前,我国社会经济已进入了一个新的历史时期,交通事业也取得了长足的发展。桥梁是交通运输的重要设施之一,给我们的生活工作带来了极大的便利。然而,在公路桥梁建设规模持续扩大的今天,我们也面临着环境和生态保护的任重。在“低碳、环保”的思想理念下,对我国桥梁建设事业提出了更高的要求。在建筑工业化当中大力发展预制装配式桥梁结构成为了一大重点,预制装配式结构的应用可以有效实现桥梁事业绿色发展的要求。为
期刊
摘 要:高速公路是我国重要的基础设施建设,对于我国人民的生产和生活都有非常重要的作用,我国在高速公路方面技术世界领先,数量以及质量都位居世界前列。在进入新的时期,照明电气设备的使用的对于高速公路来尤为重要。由于电气设备使用量在不断提升,并且承担着重要的作用,所以做好电气设备维护精细化管理,是当前高速公路工作的需求。本文主要对此进行分析,希望对相关从业人员有一定的参考作用。  关键词:高速公路;电气
期刊
摘 要:在新时期现代化建设方针落实的过程当中,居民的生活需求日益增长,为提高社会生产生活的效率,越来越多的桥梁工程投入建设。桥梁工程对于城市的发展来说有着巨大的推动作用,提高了交通的便利性,有助于城市整体经济效益与社会效益的提升。为了保证桥梁施工建设的质量,目前使用最为广泛的预应力技术能够保证桥梁施工质量以及其耐久性。本文主要针对桥梁预应力管道压浆质量检测进行了详细的分析。  关键词:桥梁施工;预
期刊
摘 要:随着经济不断的发展,人们的基本需求也随之不断变化,信息化的时代已经悄然来到我们身边,信息技术已经被广泛地应用到各行各业,信息化产业的发展已然成为国民经济增长的主要动力。而人们日益增长的经济文化水平,使得人们的日常生活中的基础物品增多,而车辆的出现在满足人们的出行需求的同时,也增加了交通量,导致公路承受的压力逐渐增大,而采用信息化技术对公路养护进行全方位的管理,已经成为现代化城市建设的主流需
期刊
摘 要:动力性和燃油经济性是评价防爆矿用车的重要指标,也是产品设计、开发过程中应该重点考虑的因素。本文针对某款防爆矿用车的动力性、经济性,利用AVL-CRUISE软件,建立防爆矿用车动力的传动系统模型,对其动力性能和燃油经济性进行仿真分析。通过整车试验试验,验证AVL-CRUISE软件仿真计算结果。  關键词:防爆矿用车;防爆柴油机;燃油经济性;CRUISE;最大爬坡度  0 引言   随着煤矿
期刊