【摘 要】
:
目前的语义分割方法可以得到行人的轮廓,但在行人相互遮挡时,无法直接得到图中行人的数量,身高和中心位置等信息。针对这一缺陷,本文提出G-UNet模型算法:在语义分割主干之外,增加一个行人区域的高斯椭圆密度核检测分支,通过核的极大值点、垂直和水平轴尺度,分别检测行人的中心位置、高度和宽度,并由密度核极大值点的唯一性,解决了行人遮挡的检测难题。另外,UNet以空间对称的方式将底层和高层特征进行硬性的拼接
论文部分内容阅读
目前的语义分割方法可以得到行人的轮廓,但在行人相互遮挡时,无法直接得到图中行人的数量,身高和中心位置等信息。针对这一缺陷,本文提出G-UNet模型算法:在语义分割主干之外,增加一个行人区域的高斯椭圆密度核检测分支,通过核的极大值点、垂直和水平轴尺度,分别检测行人的中心位置、高度和宽度,并由密度核极大值点的唯一性,解决了行人遮挡的检测难题。另外,UNet以空间对称的方式将底层和高层特征进行硬性的拼接,使得50%的固定误差直接传播到底层。我们提出可训练的柔性系数拼接方式,可以得到最优的误差分配传播方式。
其他文献
对于大量的卫星和地面站资源,随着观测任务与日俱增,如何高效安排对应的一体化成像数传活动成为了提升卫星管控效能的关键。在综合考虑实际约束的基础上,文章建立了数学模型来详细描述成像卫星联合任务规划问题,通过采用统一资源编码的思想设计了一种简单且易于理解的个体表示方法,并利用任务有效执行期的潜在冲突关系提出了相互冲突任务集的概念来降低问题求解的时间复杂度,由此生成了相应的算法框架。最后运用多个测试实例验
为了克服经典协同稀疏解混算法的不足以及全变差正则项引起的边缘模糊问题,同时考虑到稀疏性和空间信息对解混精度提高的重要性,采用结合超像素和低秩的协同稀疏高光谱解混算法,进行了理论分析和实验验证。该算法对高光谱图像进行超像素分割,并对每个超像素施加协同稀疏性约束。此外使用低秩正则项代替传统的全变差正则项来利用空间信息,选取一组模拟数据和一组真实数据进行了实验。结果表明,模拟实验中信噪比为30dB时得到
为了解土壤有机碳矿化的研究进展和未来发展趋势,以Web of Science核心合集数据库中1045篇土壤有机碳矿化的研究论文为数据源,通过CiteSpace、VOS viewer和GIS分别以发文数量、总/平均被引频次等为指标,对国家、机构、作者等进行了分类与可视化展示。结果表明:1982—2020年间,土壤有机碳矿化研究的发文数量不断增长,尤其是1993—2019年。美国总发文量第一且中介中心
为解决基于LiDAR点云杆塔倾斜检测方法鲁棒性低、自动化程度差等问题,利用杆塔塔身各层在水准面上投影成标准矩形的结构特征,提出一种基于分层最小外接矩形与抗差估计的LiDAR点云杆塔倾斜检测方法。首先,利用每一层点云最小外接矩形的面积、比例变化过滤塔头、高低腿等非对称杆塔结构,将杆塔塔身各层点云最小外接矩形中心点作为中轴点;其次,利用最小外接矩形四边与点集的内切点高程值进行高差检验,在杆塔中轴线拟合
Due to its inherent characteristics of flexible mobility, unmanned aerial vehicle (UAV) is exploited as a cost-efficient mobile platform to assist remote data collection in 5th generation or beyond 5t
行人重识别目标是利用计算机视觉技术判断在多个摄像头下采集的图像序列或视频中是否存在特定的行人,其本质是跨境头行人检索问题。基于监督学习的行人重识别方法取得了显著的检索效果,然而难以解决行人重识别存在的跨域问题,即在一个数据集上训练的模型直接应用到其他数据集时,会出现准确率显著下降的情况。为解决这一问题,提出一种基于域自适应的无监督行人重识别算法。首先,为挖掘不同行人重识别数据集间潜在的特征关联,提
针对复杂情况下吸烟行为识别效果差以及数据样本缺少的问题,本文提出一种基于弱监督细粒度结构与EfficientDet网络的吸烟行为识别算法。算法采用弱监督细粒度两级注意力模型框架,首先采用结构化的方法检测出图像块的特征边缘,并利用非极大值抑制对边缘进行筛选,形成候选区域块;然后通过融合选择相关块形成特定物体的物体级筛选器以及定位判别性部件的局部级筛选器的结果来对吸烟行为进行有效的识别;其次,物体级筛
针对RGB-D相机与抓取机器人的本体之间的手眼标定问题,提出了基于目标检测的机器人手眼标定方法。本方法将3D打印球作为标靶球夹持在机械手末端,使用改进的yolov3网络实时定位标定球球心,计算机械手末端中心在相机坐标系下的3D位置;运用奇异值分解方法求解机器人坐标系与相机坐标系转换矩阵的最小二乘解。仿真实验结果表明,标定误差成正态分布,误差方差稳定。最后,在6自由度UR5机械臂和Intel Rea
地震灾害可能造成电气互联系统基础设施的严重损坏,导致停电停气事故。为评估和提升地震灾害下电气互联系统的能源供应能力,本文首先构建了计及地震空间分布和震级不确定性的电气互联系统元件失效概率模型;其次,提出了基于两阶段气网优化潮流模型的电气互联系统最优负荷削减算法,提升了收敛性和计算效率;在此基础上,建立了地震灾害下电气互联系统韧性评估及提升方法;最后,基于IEEE RTS 79电网和14节点气网,搭
面部视觉信息和语音信息是人机交互过程中最为直接和灵活的方式,从而基于智能方式的人脸和语音跨模态感知吸引了国内外研究学者的广泛关注.然而,由于人脸-语音样本的异质性以及语义鸿沟问题,现有方法并不能很好地解决一些难度比较高的跨人脸-语音匹配任务.提出了一种结合双流网络和双向五元组损失的跨人脸-语音特征学习框架,该框架学到的特征可直接用于4种不同的跨人脸-语音匹配任务.首先,在双流深度网络顶端引入一种新