基于时空分析的显著目标提取算法的研究

来源 :北京交通大学 | 被引量 : 1次 | 上传用户:jishunhui
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
显著目标提取是检测视觉输入中具有独立视觉意义的显著区域(目标),对后续行为分析、语义判断、场景理解等高级视觉任务具有重要意义,是计算机视觉研究领域中经典课题。近年来,随着穿戴式摄像设备的大量应用,基于第一视角视频(EgocentricVideo)的显著目标提取引起研究人员的广泛关注。以时空分析方法为基础,针对Egocentric Video的特点,研究基于第一视角视频的显著目标提取具有重要的意义。本文以多个不同视角、相同时间拍摄的第一视角图像序列为输入,结合时空分析方法研究基于第一视角视频的显著性检测算法和目标检测算法。本文的主要工作如下:(1)研究了基于时空分析的融合显著性算法。针对第一视角视频背景变化剧烈、目标尺度差异明显和视角时变性强的特点,提出一种融合自顶向上的图像显著性、Ego-Motion信息以及目标运动信息来计算第一视角视频中目标的显著性方法。显著性检测实验表明,本文算法针对第一视角视频的显著性检测较IT、GB、SR、CA、AGV算法更优。(2)研究了基于融合显著性的显著目标提取算法。提出了一种融合第一视角视频显著性约束的Canny边缘检测方法,减少了大量背景区域的边缘。根据格式塔规则中的闭合性对编组元进行度量,得到编组元之间的闭合关系,通过分析编组元之间的闭合关系与第一视角视频的显著性,提出度量编组闭合性的目标函数,并利用最小权值最优匹配算法求解目标函数,得到最终目标的闭合轮廓。实验表明,与RRC轮廓编组算法比较,本文算法能够获得第一视角视频中更高质量的运动目标轮廓。(3)研究了基于多视角时空分析的显著目标提取算法。提出一种基于群体检测的显著目标提取的方法。针对第一视角视频,结合时空信息,提出基于注意力线索的瞬时关注度和时空关注度的计算方法,实现目标间相互关系的度量,以及基于自适应K-Means聚类方法的群体检测算法生成群体检测结果,最后可以得出目标(拍摄者)最为关注的目标。本文算法在Party Scene数据集上检测群体的平均正确率达到92.5%。
其他文献
在大数据存储研究领域中,数据存储与维护是一个具有挑战性的研究课题。由于数据量爆炸式增长,导致数据中心的数据规模庞大且冗余度高,不仅耗费巨大的存储空间和能耗,而且数据
人脸识别是指通过分析人脸视觉特征信息来判断人的身份的一种自动化计算技术。最近几十年,人脸识别随着计算机处理信息水平的提高而有了很快的发展,为身份识别的自动化发展提供
我们如今生活在一个全球化的时代,能非常容易的访问大量信息,尤其是“图像”。如果我们能够分类所有的数据,这会使得访问变得更加容易和快速。这便是“计算机视觉”这个经典问题
互联网的快速发展推动着P2P(Peer to Peer)流媒体技术的前进,目前中国是P2P流媒体技术发展最快的国家之一。由于P2P流媒体系统中节点的匿名性、自主性,节点的目标往往是最大
信息安全在智能电子交互式技术手册(Interactive Electronic Technical Manual,IETM)系统中是十分重要的,但是针对这个问题的研究还比较少。智能IETM的应用越来越广泛,因此在
随着当前网络信息的迅猛发展,网络资源日益膨胀,人们对网络的依赖也日益增加,这就迫切需要网络技术研究者对网络资源进行有效合理的分类,满足用户对网络信息的需求,能及时迅速的找
无线射频识别(RadioFrequencyIdentification,RFID)技术,是一种利用射频信号和空间耦合或雷达反射的传输特性,实现物品的非接触式自动识别技术。RFID技术兴起于20世纪80年代,具有
论文主要论述了企业建立数据仓库的必要性和企业数据仓库的建设过程,并从需求分析、数据路线、技术路线、应用路线等方面介绍了企业数据仓库的建设。提出了新型的企业决策管
目前高清/超高清视频点播服务日益流行,引起了越来越多的研究人员和互联网公司的关注,例如PPTV、YouKu以及Xunlei kankan等等。虽然高清视频点播服务给用户带来了很好的体验效