【摘 要】
:
共同关注目标估计是计算机视觉领域中近年来从视频显著性检测、人物视线交互等研究领域演变而来的课题,旨在根据场景内目标的注意力信息来估计场景内的共同关注目标。已有的共同关注目标估计方法一般将实验场景设定在室内等狭窄的空间,在算法的实际应用上存在明显的局限性。本文针对该问题,提出基于多视角相机的拍摄框架,利用多个水平视角的相机拍摄场景的局部信息来提取场景内行人的注意力信息,通过引入俯瞰视角的相机拍摄场景
论文部分内容阅读
共同关注目标估计是计算机视觉领域中近年来从视频显著性检测、人物视线交互等研究领域演变而来的课题,旨在根据场景内目标的注意力信息来估计场景内的共同关注目标。已有的共同关注目标估计方法一般将实验场景设定在室内等狭窄的空间,在算法的实际应用上存在明显的局限性。本文针对该问题,提出基于多视角相机的拍摄框架,利用多个水平视角的相机拍摄场景的局部信息来提取场景内行人的注意力信息,通过引入俯瞰视角的相机拍摄场景的全局信息来协助估计共同关注目标,首次将该课题的实验场景拓展至户外场景,提高了场景的泛化性。本文提出了一种在室外场景下利用多视角相机采集行人注意力信息来综合分析行人共同关注目标的方法,结合多个水平视角的相机提取行人的头部朝向信息,并在俯瞰视角下进行注意力信息汇总,来估计场景内共同关注目标。基于场景拍摄框架的特殊性,本文提出了全新的多视角相机的数据集,并在数据集上进行了大量的行人标注工作,适用于本课题及多视角相机相关工作的研究。本文在全新的多视角相机数据集上进行了验证,在三个实验场景上均取得了良好的精度,并对失败案例进行了分析,讨论了影响实验结果的因素,总结了实验存在的问题,对未来的工作方向提出了展望。
其他文献
近些年来,文化创意产业发展迅速,其带来的经济效益不断增加。文章以创意产业发展为研究对象,调查了德国汉堡市文化创意产业的发展现状。通过对其现状进行深刻剖析,明确文化创意产业的经济增长进程,了解该行业在德国汉堡市的产业规模,以及德国对于该行业的相关鼓励政策,阐明文化创意产业对于经济发展的意义及作用,继而探析创意产业的发展潜力,表明文化创意产业发展的重要性。为决策者制定文化创意产业发展计划提供参考,从而
城市工业化进程速度的提升改善了人们的生活质量,但是也给我们生活的环境带来了很多压力。频繁的雾霾天气给人们的生活带来了很大的影响,同时图像处理以及计算机视觉技术在智慧交通、军事安全、视频监控等领域的应用范围也逐渐扩大。因此如何利用图像去雾技术提高图片的清晰度,恢复图像细节成为近年来学术研究的热点问题。在雾霾条件下,物体表面反射的光线与空气中遇到的细颗粒物互相碰撞导致最终拍摄的图片质量下降,使得在室外
能够从他人的面部表情或者言语表达中准确感知所要表达的情感对于成功的社会交互非常关键。先前关于情感认知的研究大多是单模态的,与多模态情感语音感知相关的研究相对匮乏,研究结果也不具有一致性。关于多模态情感信息整合的研究由来已久,使用不同的脑活动测量方法确定了涉及情感信息视听整合的脑区位置,主要集中在双侧颞上区。然而,研究中采用的方法相对单一,并且研究内容很少包含语音信息。因此,在多模态刺激条件下,不同
随着通信技术的不断发展,移动流量暴涨的同时用户对网络服务的需求也变得更复杂,然而仅靠升级网络基础设施不仅需要较长的时间,还严重提高了运营成本,同时在移动网络内存在着严重的流行内容重复下载问题。因此,有必要基于“设备-设备”(Device-to-Device,D2D)通信技术将用户在线上的下载需求转为通过线下设备间的直接分享实现。此外,在用户使用D2D分享时还会形成移动社交网络,我们还可以挖掘其中具
脑部肿瘤是一种颅内局灶性症状疾病,脑肿瘤分类更是计算机视觉在医学领域中的一项应用研究。当前,基于深度学习的神经网络模型对脑部核磁共振图像进行图像分析并区分患者的肿瘤类别,在临床医学领域具有良好的应用前景。然而不同于自然图像,核磁共振图像有背景复杂和像素值低的特殊性,使得在脑肿瘤分类任务中肿瘤边界模糊和肿瘤标签有效性过低,肿瘤大小和位置不清晰,导致神经网络模型不能精确地对目标区域进行特征提取。针对上
在真实社会中,许多数据可以表现成网络的形式。例如:社交网络中人与人之间的关系可以表现为网络的形式,电商中用户和商品的行为关系可以表现为商品网络的形式。随着现代互联网的发展,海量的数据在互联网中产生,通过这些数据的内在联系将他们构建成网络数据可以充分的挖掘出其中包含的知识。在工业场景这些网络数据的具体应用场景包括:风控场景下的用户分类、电商场景中的用户对商品的购买点击的行为预测等。深度生成模型是表征
图像质量评价是指通过对图像进行相关特性分析,量化视觉失真程度,得到其质量分数的过程。无参考图像质量评价旨在不提供原始图像信息的情况下,对失真图像进行质量评价,其更接近于实际应用并且更具挑战性。通过无参考图像质量评价,可以更好地监控图像质量并进一步引导各种图像处理系统的优化。自然图像和屏幕内容图像是图像质量评价领域的重点研究对象,故本文主要围绕这两类图像来设计合适的无参考质量评估算法。由于目前基于卷
车载网络为交通管理提供了收集道路相关的信息的平台。通过车辆的信誉值来计算车辆报告的信息的可信度是解决车辆报告错误信息问题有效方法。传统的中心式信誉管理系统存在单点故障,不能适用于大量车辆场景等问题,分布式信誉管理系统存在信息不一致,分布式节点容易被攻击等缺点。基于区块链的信誉管理系统在解决上述问题的同时带来了信息更新不及时,计算资源消耗较大,存储压力增大等问题。因此如何解决这些问题是一个巨大的挑战
本文详细分析了电气控制线路的常见故障,并结合实际经验总结出了几种有效的故障诊断及维修策略,以供参考。
随着数据收集和特征提取技术的发展,数据可以由不同类型的特征描述。例如,一个人可以由人脸、指纹以及签名等不同类型的信息表示;一张图像可以由纹理、颜色以及形状等不同类型的特征表示。来源不同的特征之间既有共享信息,也有互补信息。因此,如何有效地整合多种来源的信息是多视角学习研究中的重点。然而,传统机器学习任务很大程度依赖于标签数据,但标签的获取往往费时费力。因此,如何利用无标签数据辅助完成机器学习任务同