【摘 要】
:
随着深度学习技术的发展,基于深度学习的视频目标分割算法已经成为了处理视频目标分割任务的主要方法。但是深度学习模型需要大量的训练数据进行训练,可以预见,靠人工制作视频目标分割数据集将无法满足规模日益扩大的视频目标分割模型的训练需求。基于自监督学习的视频目标分割算法以其不需要人工标注数据集即可对视频目标分割模型进行训练的特点受到了广泛的关注。由于使用的数据集没有经过人工标注,自监督学习方法将直接决定视
【基金项目】
:
陕西省重点研发计划项目(No.2019ZDLGY09-05); 国家自然科学基金(No.61772399);
论文部分内容阅读
随着深度学习技术的发展,基于深度学习的视频目标分割算法已经成为了处理视频目标分割任务的主要方法。但是深度学习模型需要大量的训练数据进行训练,可以预见,靠人工制作视频目标分割数据集将无法满足规模日益扩大的视频目标分割模型的训练需求。基于自监督学习的视频目标分割算法以其不需要人工标注数据集即可对视频目标分割模型进行训练的特点受到了广泛的关注。由于使用的数据集没有经过人工标注,自监督学习方法将直接决定视频目标分割模型的性能,而有效的模型框架也是提高视频目标分割模型性能的关键。因此,搭建有效的视频目标分割模型,并设计高效的自监督学习方法,是该课题研究中的重点。本文具体研究工作如下:(1)为了进一步提高视频目标分割模型从视频帧中提取的特征对大尺寸目标和小尺寸目标的泛化性,本文提出了基于多像素尺度图像重建的自监督学习方法,通过不同像素尺度的图像的重建任务,使得模型提取的特征兼顾小尺寸目标和大尺寸目标。实验证明通过多像素尺度图像重建的自监督训练任务训练得到的模型较单一像素尺度图像重建的训练任务得到的模型有更好的表现。(2)针对视频目标分割模型在进行视频目标分割时误差累积导致错误分割的问题,本文提出通过图像中目标边缘对目标分割掩膜进行修正。为了在自监督范式下提取目标边缘,本文提出了基于自监督的边缘检测算法。实验表明,通过该方法提取候选目标边缘的表现要好于Canny算法等无监督方法,更加适用于自监督视频目标分割任务。(3)为了根据目标边缘修正视频目标分割结果,本文提出了基于边缘修正的自监督视频目标分割算法。该方法能够使用自监督学习方法训练边缘融合网络,并根据侧输出边缘检测网络预测的候选目标边缘对视频目标分割模型预测的目标粗分割掩膜进行修正,得到更为精细准确的目标分割掩膜。实验表明,该模型能够根据目标帧的候选目标边缘对骨干视频目标分割模型预测的目标帧的目标粗分割掩膜进行修正,效果要好于传统视频目标分割模型。
其他文献
传统的单体应用架构因具有部署容易、测试方便的特点被广泛运用,然而随着业务需求的增长和互联网技术的发展,单体应用逐渐出现部署效率低下、扩展性差、技术迭代困难等问题。微服务技术以其松耦合、高扩展性的特性解决了单体应用架构的困境,微服务架构根据项目的业务逻辑将其拆分为多个服务,每个服务被独立部署,都拥有独立职能,各自完成独立的功能逻辑,无需关注其他服务的开发,提升了开发效率。在微服务架构背景下,用户发出
随着互联网与计算机科学技术的高速发展,运用软件系统来解决复杂实际问题的场景越来越丰富。然而随着业务访问量的不断增大,软件系统的负荷不断加重,性能不断下降,迫切需要提升软件系统的性能以适应更多的应用场景。软件系统的性能很大程度上取决于其本身的参数配置,很多组织依靠聘请专家来配置参数,费用往往十分昂贵;并且随着软件系统规模和复杂性的不断增大,传统人工优化参数越来越困难,如何实现自动优化软件系统参数配置
步行作为最基本的出行方式,具有减碳和促进居民健康双重积极意义。本文聚焦于人体如何感知步行舒适度这一基础的研究议题。通过对北京市中心城区交通情况的分析,本文发现北京步行交通的需求正在不断提升。随后本文使用citespace软件对国内外城市可步行性领域的文献进行总体分析,发现在微观层面对步行过程中人体感知的研究文献总量有限。基于分析结果,本文从视觉感知、听觉感知、嗅觉感知和热感知入手,详细归纳总结在步
随着军事科技的发展和深空探测活动的不断开展,卫星作为探索太空的必要航天器,更容易受到强电磁脉冲武器的威胁,其中太阳能电池作为卫星中重要的供电组件,对卫星平稳安全的运行起到了不可或缺的作用。同时,由于小型卫星上有限的载荷空间和载重,很难安装大型反射器,所以可利用太阳能电池作为反射阵天线的阵列平面。因此,在强电磁脉冲武器的打击下,探究太阳能电池单元及用于反射阵天线的集成电池单元的耦合机理尤为重要。本文
巴伦作为一种不平衡-平衡转换器,被广泛应用在天线、推挽放大器和倍频器的差分馈电和阻抗匹配上。随着通信技术的迅速发展,巴伦的高功率、超宽带和小型化等特性成为微波器件领域亟待解决的热点问题。不同于集总元件式巴伦和微带线式巴伦,同轴巴伦采用功率容量较大的同轴线为功率载体,具有更好的高功率处理能力,同轴线的宽带特性有利于巴伦的超宽带和小型化设计。因此,同轴巴伦的研究对高功率宽带巴伦领域具有十分重要的意义。
随着社会逐步走向科技化与智能化,计算机视觉技术也迎来了前所未有的发展热潮。为了进一步理解视觉世界,研究者不再局限于像目标检测这样简单的场景识别任务,而是转向对复杂场景中各种视觉关系的理解。在多种视觉关系中,人和物体的交互关系最能体现一个场景中的主题。本文主要着眼于视频中的人物交互识别任务,相比于图像人物交互检测,视频任务的关注要点从空间关系转移到了时空关系上。目前的视频人物交互识别算法大多使用实例
目的:探索血肿周围1cm区域内的Tmax值与高血压性脑出血肢体运动功能预后的相关性。方法:收集资料:收集2020-12-31至2022-01-31期间在第二附属医院就诊的符合纳入标准的45例高血压性脑出血患者,记录一般资料(性别、年龄等)、影像学资料(CT、CTP、CTA),CTP资料包括:感兴趣区域血肿区(A区)、血肿周围1cm范围内区域(B区)、B区健侧半球镜影区(B1区)的CBF、CBV、T
近年来,深度学习理论发展迅速,在遥感图像分类、分割、检测等任务中得到了成功地实践。相比于传统遥感图像目标检测算法,深度学习方法提取的特征更具完备性,检测精度更高,然而针对具有大尺度变化的目标,其目标检测的效果较差。在遥感图像中,具有大尺度变化的目标相对数据集中其它目标数量较少,符合典型的长尾分布,这是导致大尺度变化目标检测效果不理想的原因。图像数据扩增技术为缓解深度学习的数据过拟合和提升模型的泛化
随着我国经济发展,各行业对电力能源的应用需求进一步增大,保障电力系统运行安全稳定显得比较重要。继电器技术在电力系统保护方面发挥着重要作用,为能有效促进电力系统良好运行,将继电器技术合理应用在电力系统中较为关键。基于此,本文就电力系统保护中继电器技术应用价值以及影响因素进行分析,然后就继电器技术应用发展探究,希望能为电力系统良好运行起到积极作用。
近几年来,由于无人机技术的不断提高和完善,其制造成本和操作难度大幅降低,使无人机作为一种新兴的消费级产品广泛应用于我们的日常生活中。由于无人机体积小,隐蔽性强的特点,经常被不法分子应用于大量的非法活动中,如无人机扰航、非法拍摄、搭载危险品进行恐怖活动等,严重影响了公民人身安全。自2016年起,我国陆续颁布了多部无人机管理相关的政策文件,来保障人民的低空安全,但因无人机“黑飞”而导致的安全隐患问题仍