基于深度学习的公交车乘客头部检测及属性识别

来源 :天津理工大学 | 被引量 : 0次 | 上传用户:haosy2966
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
行人的检测和属性识别属于计算机视觉的研究内容,它们的任务是从图像或视频序列中找到“感兴趣”的区域,并对“感兴趣”的区域标记和分析。近年来,基于深度学习的算法提高了检测识别的性能,得到了更多的关注。本文研究在公交车场景下乘客的头部检测及属性识别,由于乘客被拍摄的角度是俯视视角,乘客的头部信息最多且不易受遮挡影响,所以把乘客头部作为检测目标,并且不同乘客拥有不同的头部特征信息,通过特征学习可以有效地识别属性。尽管目标检测和属性识别取得了很大发展,但在实际的公交车应用场景中仍面临不少问题:第一,乘客上车途中的头部尺度发生变化,甚至产生形变;第二,拥挤的人群导致头部部分信息被遮挡;第三,不同光照环境下相同头部目标产生不同变化。为了解决以上问题,本文基于深度学习的算法搭建了头部检测及属性识别网络用以学习头部特征。本文的具体工作如下:1)构建基于简化YOLOv3的公交乘客头部检测网络。首先分析了基础网络结构对检测模型的影响,设计了轻量的基础网络结构并嵌入到检测框架中,构建了公交车乘客头部检测的数据集,接着与其他网络模型做了对比实验,实验结果表明提出的模型能实现高准确度、实时的头部检测,同时在公共数据集Brainwash上也有不错的表现。2)设计基于注意力机制的头部属性识别网络。首先设计了基于注意力机制的属性识别网络结构和带有权重参数的损失函数,构建了公交车乘客属性识别的数据集,接着通过对比实验分析了不同注意力模块对识别性能的影响,实验结果表明加入注意力融合模块能得到更好的属性识别效果。
其他文献
随着工业和社会的发展,我国农田镉污染问题越来越严重,镉污染使作物生长受到抑制,降低作物的产量和品质。烟草是我国的重要经济作物,具有很强的镉富集能力,烟草镉污染会对吸
虽然正交频分复用(Orthogonal Frequency Division Multiplexing,OFDM)技术在现代通信系统中占据主要地位,但是随着物联网和智慧城市等产业的快速发展,OFDM技术在频谱利用率、用户体验速率和流量密度等方面都面临巨大的挑战。滤波器组多载波技术(Filter Bank Multicarrier,FBMC)利用时频特性良好的原型滤波器获得了更高的频谱利用率和更小的
经济快速发展为市场主体提供了新的发展机遇,作为金融行业的重要参与主体,商业银行在实现自身快速发展的同时,也面临着严峻的挑战。目前国内的商业银行并未建立完善的内部控制制度,管理机制也不健全,时常会出现风险事件,金融案件不断出现。而近几年互联网金融的兴起,给银行内控管理的合规性带来了新的挑战。2020年爆发的新冠肺炎疫情极大程度改变了商业银行与客户的交互方式,进一步加大了商业银行风险管理要求。新形势下
学位
基于淮南潘谢深部区块内部及外围的煤层气/瓦斯含量、镜质组反射率等实测资料、钻孔剖面测温成果,结合等温吸附实验,分析了研究区煤级梯度及现代地温梯度,探讨了深部煤层含气
随着经济社会的迅速发展,互联网逐渐走入寻常百姓家,互联网的出现不仅使人们的生活方式日新月异,社会生活也变得更加丰富多彩。在互联网迅速发展、信息爆炸的背景下,传统商业模式既获得了机遇也迎来了挑战。电子商务的出现给人们带来了崭新的购物模式,节省了购物时间,提升了购物效率。人们借助电子商务平台足不出户就能购买到想要的商品。近些年随着智能手机的普及,电子商务情景下的网购变得愈加便利。电子商务给人们带来巨大
2016年,水利部、国家发展改革委联合印发了《“十三五”水资源消耗总量和强度双控行动方案》,该方案强调了水资源消耗总量和强度控制对我国现行社会经济发展的重要性,要求各方必须严格贯彻方案的精神,切实推进各项措施的实施,促进我国用水方式随经济发展方式的有效转变,为全面建成小康社会提供水安全保障。在该方案中,沿用了《最严格水资源管理制度》中的三项指标“万元国内生产总值用水量”、“万元工业增加值用水量”、
近年来,我国人口老龄化进程加快,政府监管部门、潜在投资者和社会公众都越发关注医药行业的整体发展情况,然而随着医药市场份额的扩大、营业收入的增长,利润产出指标却呈现波动下降的趋势。立足于公司治理角度,股权集中度直观反映了公司的股权结构,通过已有研究发现股权过于集中或分散都不能够正向作用于公司治理;内部审计部门作为企业内部的一种辅助监管部门,具备监督评价的职能,其建设质量的高低直接决定内部审计在工作时
学位
视频中的人体行为识别在计算机视觉中占有重要的地位,有着广阔的应用前景和潜在的经济价值和社会价值,受到了世界各地研究机构及研究者的关注。先前的人工特征泛化能力不强,通过人工特征进行行为识别的方法局限性较大。近年来,随着深度学习的发展,基于深度学习的行为识别受到了广泛的关注。但是,行为识别仍然是一个具有挑战性的问题,本文针对现有行为识别方法进行总结分析,给出了以下贡献:首先,本文构建了一个金字塔空间-
本文选取了2007年1月至2017年4月最近十年的沪指日收盘价数据,并利用公式rt(28)lnct-lnct-1得到对数收益率序列,其中tr和tc为第t天的日对数收益率和收盘价。应用时间序列的GARCH模型族和机器学习的vSVM算法及其改进算法对该对数收益率进行建模,应用各个模型对未来收益率的波动率进行预测,最后比较各个模型在预测性能上的优劣。首先,对该对数收益率进行基本的统计分析之后,发现了其“
随着我国经济的飞速发展,对能源的需求日益增加,许多大型水库的修建,极大的缓解了我国的能源压力。然而,水电资源开发的同时也带来了库区移民问题。向家坝电站地处金沙江下游川滇两省交界河段上,是国家实施“西电东送”的骨干项目。宜宾市屏山县作为此次项目中库区淹没涉及人口面积最多、受损最重的地区,其移民安置工作是否顺利进行关系到此项工程是否能够最终完成。根据《向家坝水电站屏山县库区农村移民安置暂行办法》,无土