【摘 要】
:
多光谱行人检测已经成为自动驾驶、安全防卫等全时段运行与监控的关键技术之一,而基于深度学习的多光谱行人检测技术也已经成为了多光谱行人检测研究中的重中之重。目前存在的基于深度学习的多光谱行人检测技术相较过去虽然已经有了长足的进步,但仍存在以下不足:1.目前存在的多光谱行人检测模型大多直接将原始的可见光图像与热红外图像作为输入,但通过热红外相机直接获取的热红外图像会受到道路上其他热源或物体因光照变热的干
论文部分内容阅读
多光谱行人检测已经成为自动驾驶、安全防卫等全时段运行与监控的关键技术之一,而基于深度学习的多光谱行人检测技术也已经成为了多光谱行人检测研究中的重中之重。目前存在的基于深度学习的多光谱行人检测技术相较过去虽然已经有了长足的进步,但仍存在以下不足:1.目前存在的多光谱行人检测模型大多直接将原始的可见光图像与热红外图像作为输入,但通过热红外相机直接获取的热红外图像会受到道路上其他热源或物体因光照变热的干扰,这会产生热红外图像背景复杂,物体区域暗淡不均等问题。此外,由于在一般情况下道路场景中行人目标相对整个图像中其他背景目标较少,目前存在的数据增强方法用在行人检测领域时可能会发生丰富背景的同时造成行人目标丢失的问题。2.目前存在的多光谱行人检测算法中在融合方式上往往通过整张图像总体的光照强度来设计可见光与热红外模态融合权重,忽略了局部阴影的情况,因此需要设计一个适合于两个模态根据局部信息自适应调整融合权重的融合方法。3.目前的多光谱行人检测算法在自动驾驶运行较快时存在检测精度达到时检测速度不够快,寻求一种在保证检测精度的前提下尽量提升检测速度以达到速度与精度最佳平衡。针对以上的问题,本论文分别从以下几方面进行研究:1.提出了使用低通滤波技术对热红外图像进行增强处理。通过使用低通滤波方法对热红外图像进行处理可以减少背景热源带来的干扰噪声。另外,提出了一种数据增强算法限制合并混合(Limt-Merge Mix),在模型进行训练之前对两张图像上下区域无关背景信息进行裁剪,将剩余图像及标签进行上下合并,同时合并热红外相邻两张图像以及可见光相邻两张图像作为新的训练数据对模型进行训练,在有效丰富背景信息的同时,不会丢失待训练的行人信息。2.提出了一种自适应加权的多光谱融合网络来融合两个模态的不同信息。多光谱融合网络设计中双特征提取主干提取的特征图在进行融合之前插入了通道注意力和空间注意力机制模块(CBAM)。在融合阶段创建了一个新的自适应两个模态的加权机制,并对加权后的特征图使用了显著性特征检测模块(Pi CANet)来对全局或者局部感兴趣目标进行加强。在YOLOv4的损失函数中加入了Focal Loss以解决行人检测中样本不平衡的问题。所提出的多光谱融合网络模型在KAIST数据集上对全时段平均精度(Average precision)达到90.03%,在每张图片的平均假阳性个数(False Positive Per Image,FPPI)的对数值取10-2~10~0时平均对数丢失率(Log-Average Miss Rate)为8.56%,比CS-RCNN检测模型在检测效果的平均精度指标高0.09%、平均丢失率指标低0.31%。3.提出了将跨阶段局部化设计应用于YOLO Neck结构中,减少模型参数,降低模型计算量,在具有多尺度检测能力的同时提高模型检测速度。在多光谱融合网络结构的多尺度融合网络中进行了跨阶段局部化设计,对比原始YOLOv4模型,改进后的多尺度网络模型不仅可以通过自底向上的特征增强路径来丰富网络特征层次,还极大的降低了模型的参数量以及计算量。相比使用原YOLO Neck的模型,通过CSP降维的YOLO Neck相比原来浮点运算量降低了14.1%,模型体积减少了23.2%。对改造YOLO Neck后的网络模型进行实验,单张图像的检测速度达0.034s,比CS-RCNN检测模型在检测单张图像时的速度快0.058s,满足自动驾驶实时检测的要求。
其他文献
多孔材料的水蒸气吸附能力对除湿和集水等领域的应用至关重要,直接影响除湿和集水系统的效率。本文确定了影响多孔材料水蒸气吸附性能的评价指标,包括水蒸气吸附量、分压力、吸脱附速率和水力稳定性。为在不同工况环境参数下,选择最优的多孔吸附材料,本文比较了9种材料的吸脱附特性,其中包括7种MOFs(Metal-Organic Frameworks)材料,即MIL-101(Cr)、MIL-100(Fe)、MOF
消除贫困是人类的共同理想,也是世界各国人民一直以来的美好追求,我国人口一直高居世界首位,人力资源丰富是我们国家发展的一大优势,但也因此带来人均资源分配不足、分配不均等问题,其主要表现就是贫与富之间的巨大鸿沟。所以我国对于贫困治理的问题非常重视,把其放在发展的首位。结合马克思主义经典作家的贫困治理思想、新中国历届国家领导人的贫困治理思想、中华传统文化中济贫救困的思想和我国国情,习近平提出了符合中国实
地理文本数据易获得、规模大,蕴含了大量地理空间知识。然而,传统GIS使用的基于计算几何的地理实体空间关系抽取方法只能对地理空间几何数据进行计算,无法处理地理文本数据。因此,本文研究基于文本语义的地理实体空间关系抽取方法,自动化地将互联网中的非结构化地理文本提取为结构化的地理空间知识。目前,基于语义的空间关系计算方法主要问题包括中文文本一词多义、地理文本语法结构复杂、实体表达抽象、关系语义不明显。针
居庸关城墙为外部包砖内部夯土结构,通过调研居庸关城墙的实际病害情况,发现城墙出现裂缝、脱落、酥碱等病害,这些病害主要与城墙内芯土的强度降低、降雨入渗、冻融循环等因素有关。本文在分析城墙发生以上病害的基础上,结合建筑遗产保护的原真性原则,提出了利用建筑垃圾废旧的城墙青砖的设想,即通过实验室机械粉磨方式激活其活性制成再生微粉,之后加入到城墙内芯土中,并进行室内试验,探究再生微粉对城墙内芯土无侧限抗压强
二十一世纪首都北京面临着人口老龄化与城市发展转型的双重背景。到2035年北京老年人口接近700万,高龄老年人口将超过100万,老年抚养比将继续增加,老龄化也将加速。中共中央、国务院高度重视老年事业发展和养老体制建设。同时,《北京城市总体规划》中明确指出“老城不能再拆,通过腾退恢复性修建,做到应保尽保”。但不容忽视的是,随着北京核心区人口与功能得到有效疏解后,核心区内人口老龄化程度将会进一步加深。而
通过在北方农牧带半干旱草地生态系统(山西右玉)设置不放牧、轻度放牧、中度放牧和重度放牧4个不同强度的放牧实验,运用静态-暗箱法测定放牧第一年生长季的温室气体通量,研究不同放牧强度对该地区温室气体通量的影响.结果表明:(1) CO2和N2O在生长季表现出随着温度和水分变化的明显季节动态变化,但是与不放牧相比,第一年不同放牧强度对CO2和N2O排放速率没有显著影响;(2)放牧显著降低了土壤含水量(P
贸易保护主义抬头、新冠肺炎疫情反复不断加剧国际市场的不确定性,中国企业面临的出口形势格外严峻。在外向型经济服务快速发展的当下,金融集聚或许能成为对外贸易新的比较优势,并为企业顺利应对和适应出口危机提供有力支持。但同时金融集聚效用的发挥势必依托于一定的制度土壤,且与地区制度质量息息相关。基于此,本文从企业和金融行业异质性视角,系统测度金融集聚与中国企业出口二元边际之间的关系外,还进一步叠加制度因素和
高速道岔可动心轨作为道岔的关键部件,对车辆运行速度及安全有着重要影响。车轮与心轨型面的合理匹配,对提高车辆行驶稳定性,改善车辆通过曲线能力,降低车轮与心轨磨损,提高心轨使用寿命有着重要意义。本文运用SIMPACK动力学软件建立CRH5型动车与60 kg/m钢轨18号可动心轨的动力学模型;运用ABAQUS三维有限元分析软件,建立轮轨三维有限元弹塑性模型,分别研究不同磨耗阶段车轮通过心轨区时的动力学性
近年来,随着社会教养子女成本的增加和人们对于子女教育问题的重视,很多父母都面临着较大的亲职压力。与普通家庭的母亲相比,低收入家庭母亲往往面临更大的经济压力,而其中很多低收入母亲也同时在子女教育方面也倍感压力,从而导致很多低收入家庭母亲的亲职压力水平较高。虽然我国近年来在扶贫工作方面取得了显著的成绩,但是从相对贫困的角度看,城镇低收入家庭还会在一定时期内存在,如果不能协助低收入家庭母亲较好地应对和缓