【摘 要】
:
目前利用深度学习进行多视图深度估计的方法可以根据卷积类型可以大致分为两类。其中,基于2D卷积网络的模型预测计算速度快,但预测精度较低;基于3D卷积网络的模型预测精度高,却存在高硬件消耗。同时,多视图中相机外部参数的变化使得模型无法在物体边缘、遮挡或纹理较弱区域生成高精度预测结果。针对上述问题,本文提出了基于3D卷积的语义导向多尺度多视图深度估计算法,在保证预测精度的同时降低硬件消耗。同时针对遮挡、
论文部分内容阅读
目前利用深度学习进行多视图深度估计的方法可以根据卷积类型可以大致分为两类。其中,基于2D卷积网络的模型预测计算速度快,但预测精度较低;基于3D卷积网络的模型预测精度高,却存在高硬件消耗。同时,多视图中相机外部参数的变化使得模型无法在物体边缘、遮挡或纹理较弱区域生成高精度预测结果。针对上述问题,本文提出了基于3D卷积的语义导向多尺度多视图深度估计算法,在保证预测精度的同时降低硬件消耗。同时针对遮挡、纹理较弱等区域,利用网络自身提取的图片特征作为先验导向信息,增强网络对全局信息的感知,结合多尺度融合方法
其他文献
影像拼接是生成大规模数字正射影像的关键技术之一。针对多个影像拼接时拼接线穿过明显地物导致的鬼影现象,本文提出了一种超像素和光流引导的由粗到精的影像拼接方法。首先,通过超像素的密集光流提取影像中明显的地物信息;然后,在超像素级别上,利用Dijkstra算法进行最佳拼接区域检测;最后,结合归一化互相关成本函数在像素级别上进行拼接线的像素级优化。因优化节点的数量减少,这种从粗到细的拼接线检测策略显著提高
基于电信号的故障诊断方法适用于海流透平机叶片不平衡故障,却不适用于平衡故障。为解决基于电信号的方法无法对平衡故障进行诊断这一问题,利用轻量级神经网络对不同故障类型的图像进行分类,从而实现海流透平机叶片故障诊断。并且该方法可以减小参数量、降低对计算设备硬件要求。实验首先使用绳子模拟附着物,缠绕于海流透平机叶片以模拟海底生物附着过程,然后采集不同附着程度的图像;其次,对图像数据进行筛选、分类,组建数据
为了探究甘蔗、地毯草、芦苇、佛肚竹这四种禾本科植物的光能利用策略,该文以大田或原生境植株为材料,于炎夏伏天最热时节活体监测其叶绿素荧光特性、光合气体交换特性,并分析其色素含量。结果表明:(1)C_4甘蔗和C_4地毯草具有高净光合速率(P_n),是消耗利用光能的主要手段,并且高P_n和高水分利用率(WUE)、高量子效率(Φ_i)耦合在一起;(2)C_3芦苇也具有较高的P_n、WUE和Φ_i,其较高的
现有的大部分算法只能针对特定照度的逆光图像有出色的增强效果,不能高效率地解决各类照度的逆光图像。因此,本文提出一种基于卷积神经网络的图像增强算法,并构建一种集分解、恢复、调节为一体的新型网络架构。利用Retinex理论设计一个分解网络,将逆光图像与其对应的高光图像都分解为反射图和光照图。采用高光图反射分量作为去噪参考,修复暗光缺陷,并添加颜色饱和度模块最大程度地保留图像恢复过程中的颜色等细节。逆光
为分析不同施肥处理下我国典型农田土壤对可溶性有机碳(DOC)的吸附特征及其影响因素,选取黑土、灰漠土、潮土、红壤4种典型农田土壤,在不施肥(CK)、单施氮肥(N)、施氮磷肥(NP)、施化学氮磷钾肥(NPK)、有机肥配施化学氮磷钾肥(NPKM)5种施肥处理下,运用平衡吸附法测定DOC的吸附量。结果表明,不同土壤类型在同一平衡浓度下对DOC的吸附量有较大差异,整体表现为灰漠土、红壤>黑土>潮土。最大吸
针对复杂环境下行人目标因检测器漏检和频繁遮挡而导致的数据关联不正确、跟踪实时性差的问题,提出了一种基于免锚检测的多目标跟踪算法。算法采用预测目标中心点热力图的方法实现目标检测定位,改善了因锚点框回归歧义所导致的漏检问题。同时在检测模型中嵌入深度表观特征提取分支,构建联合检测与跟踪的多任务网络用于提升实时性。为解决跟踪阶段行人因遮挡而引起的数据关联错误和轨迹丢失问题,提出加权多特征融合的相似性度量算
针对舰面场景复杂、目标相互遮挡导致检测率较低等问题,在YOLOv3算法基础上提出了适用于舰面目标检测的增强YOLOv3算法。在输入网络中加入融合的数据增强策略对图像进行色域变换、裁剪、遮挡等操作,设计了多种类图片选取、变换及组合方式来丰富样本信息;针对舰面目标尺寸的特点,利用K-means算法重新设计与检测目标相匹配的先验锚框并分配至对应的预测尺度,以加速模型收敛;在输出网络中通过线性函数对Sof
针对传统的绝缘子状态识别方法存在实时性差、特征提取能力不足的问题,基于边缘计算的思想,提出了一种融合多维度特征的绝缘子状态边缘识别方法。利用云边协同和边边联邦协同的联合技术手段,构建了绝缘子状态的边缘识别框架。设计了一种融合多维度特征提取的深度学习网络,该网络采用ResNet101作为主干特征提取网络,使用Inception模块构建数据池化层,嵌入压缩激励模块和卷积注意力模块,从不同维度对特征进行
视频动作检测研究是在动作识别的基础上,进一步获取动作发生的位置和时间信息。结合RGB空间流和光流时间流,提出了一种基于SSD的区域时空二合一动作检测网络。改进了非局部时空模块,在光流中设计了像素点筛选器来提取运动关键区域信息,只对空间流中筛选出的动作关键区域进行相关性计算,有效获得动作长距离依赖并改善非局部模块计算成本较大的缺陷,同时降低了视频背景噪声的干扰。在基准数据集UCF101-24上进行了
在行人重识别任务中,通常伴随着相机角度、场景变化、行人姿态变化等问题,为此本文提出一种基于注意力机制和空间几何约束的行人重识别方法。首先,构造一种深度学习网络,通过注意力机制有效挖掘并提取行人图像的空间特征。然后,利用空间几何约束将空间特征进行分解,分别计算相应的子空间特征及其空间组合特征,得到描述不同空间关系的局部特征。将描述空间关系的局部特征与全局特征相融合,从而构造出行人身份重识别的全局-局