实时视觉目标跟踪与视频对象分割多任务框架

来源 :中国图象图形学报 | 被引量 : 3次 | 上传用户：yishuiji111

【摘要】

：

目的针对视觉目标跟踪(video object tracking,VOT)和视频对象分割(video object segmentation,VOS)问题,研究人员提出了多个多任务处理框架,但是该类框架的精确度和鲁棒性较差。针对此问题,本文提出一个融合多尺度上下文信息和视频帧间信息的实时视觉目标跟踪与视频对象分割多任务的端到端框架。方法文中提出的架构使用了由空洞深度可分离卷积组成的更加多尺度的空洞

【作者】

：

李瀚刘坤华刘嘉杰张晓晔

【机构】

：

中山大学数据科学与计算机学院,广州510006;广东电科院能源技术有限责任公司,广州510080

【出处】

：

中国图象图形学报

【发表日期】

：

2021年01期

【关键词】

：

视觉目标跟踪视频对象分割全卷积网络空洞空间金字塔池化帧间掩模传播

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

其他文献

Edge-guided GAN:边界信息引导的深度图像修复

目的目前大多数深度图像修复方法可分为两类:色彩图像引导的方法和单个深度图像修复方法。色彩图像引导的方法利用色彩图像真值,或其上一帧、下一帧提供的信息来修复深度图像。若缺少相应信息,这类方法是无效的。单个深度图像修复方法可以修复数据缺失较少的深度图像。但是,无法修复带有孔洞(数据缺失较大)的深度图像。为解决以上问题,本文将生成对抗网络(generative adversarial network,G

期刊

生成对抗网络深度图像修复方法Edge-guided GAN边界信息Apollo scape数据集

深度神经网络结构搜索综述

深度神经网络在图像识别、语言识别和机器翻译等人工智能任务中取得了巨大进展,很大程度上归功于优秀的神经网络结构设计。神经网络大都由手工设计,需要专业的机器学习知识以及大量的试错。为此,自动化的神经网络结构搜索成为研究热点。神经网络结构搜索(neural architecture search, NAS)主要由搜索空间、搜索策略与性能评估方法 3部分组成。在搜索空间设计上,出于计算量的考虑,通常不会搜

期刊

人工智能计算机视觉深度神经网络强化学习进化算法神经网络结构搜索(NAS)

无参考图像质量评价研究进展

图像质量评价一直是图像处理和计算机视觉领域的一个基础问题,图像质量评价模型也广泛应用于图像/视频编码、超分辨率重建和图像/视频视觉质量增强等相关领域。图像质量评价主要包括全参考图像质量评价、半参考图像质量评价和无参考图像质量评价。全参考图像质量评价和半参考图像质量评价分别指预测图像质量时参考信息完全可用和部分可用,而无参考图像质量评价是指预测图像质量时参考信息不可用。虽然全参考和半参考图像质量评价

期刊

图像质量评价人类视觉系统视觉感知自然统计特征机器学习深度学习

帧内块复制中的位移矢量参数编码算法

目的随着云计算和移动互联网技术的飞速发展,屏幕图像编码已成为视频压缩领域新的研究热点。帧内块复制(intra block copy,IBC)算法是屏幕内容编码(screen content coding,SCC)中的核心算法,已经成为高效视频编码(high efficiency video coding,HEVC)等标准中屏幕内容编码的重要组成部分。为了进一步消除IBC算法中的位移矢量(displ

期刊

高效视频编码(HEVC)数字音视频编解码屏幕内容编码位移矢量预测编码直接编码

实时视觉目标跟踪与视频对象分割多任务框架

其他学术论文