智能视觉计算中目标跟踪状态预测及评估方法研究

来源 :天津大学 | 被引量 : 0次 | 上传用户:fantong518
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目标跟踪是智能视觉中的一项关键核心技术,也是一个重要而富于挑战性的前沿研究课题。视觉跟踪技术被广泛应用于智能化的交通系统、安防监控、多媒体、机器人等复杂工程项目中。本文研究开发的状态计算方法旨在对视频序列中的目标对象实现精准而稳定的自动跟踪,其主要内容可以概括如下:
  (一)提出了基于划分损失计算的视觉目标跟踪方法。该方法使用了增量型离散余弦变换及结构化的信息损失表示,其可以自适应地将样本图像序列做分块处理,结合划分系数,以加强目标前景区域内更具判别力局部面片的积极效应,减弱其周围背景区域可能包含附近环境干扰的负面影响。在线状态预测过程即为粒子滤波概率推断框架内,通过似然评估进行最大后验求解。
  (二)提出了基于双向缩放计算的视觉目标跟踪方法。该方法使用了判别式相关滤波模型及多通道的图像样本表示,其可以自适应地根据目标外观出现的均匀或非均匀缩放变化,分别沿着水平方向和垂直方向高效地完成尺度搜索,通过尺度状态检测响应评估及双向尺度至尺寸转换模块,以获得不同方向上的最佳尺寸,在线实时预测具有动态宽高比的矩形目标边界框。
  (三)提出了基于在线融合计算的视觉目标跟踪方法。该方法使用了证据性推理分析策略及决策级的系统线索协同,其可以自适应地利用多跟踪预测器的判别特性和互补属性,以克服复杂环境中和困难情况下,单一深度学习方案的局限。通过对目标中心和区域进行在线评估判断,融合潜在有价值的决策,抑制可能失败的决策,并在跟踪过程中完善目标状态的预测结果。
  本文所提出的跟踪算法可以有效增强真实场景中目标跟踪的状态预估能力,减轻视觉跟踪过程中出现的位置漂移偏离,以及灵活应对目标区域宽高尺寸的自由变化。目标跟踪基准测试数据上的定性与定量比较实验结果,表明了本文所提出的视觉目标跟踪方法的准确性和鲁棒性。
其他文献
病理诊断是癌症确诊的“金标准”。近些年数字病理技术普及和计算机技术快速发展促进计算机辅助病理诊断的发展,目前已有很多病理图像分析相关研究通过计算机来实现,在本文中主要的研究内容为病理图像的细胞核检测以及组织分割。但是目前病理图像的分析大多基于卷积神经网络,没有考虑到病理图像的高阶一致性。基于目前研究方法中所存在的问题,本文提出了基于生成对抗网络的病理图像分析研究方法用于解决病理图像细胞核检测和组织
学位
随着脑成像和机器学习技术的飞速发展,研究人脑如何编码信息成为了热点研究领域,越来越多的研究人员致力于利用机器学习来帮助理解人脑的工作原理。近年来,功能磁共振成像(fMRI)成为解码人脑的一项重要技术,其高分辨率特性能最大程度地捕捉到大脑某一时刻的活动信息。为了获得关于人脑的广泛性结论,汇总来自不同被试者的fMRI数据是必不可少的。而解剖结构和功能拓扑的多变性则进一步要求必须对不同的大脑活动表征空间
学位
很多的研究者开始尝试拓展现阶段的智能设备的功能,使其够感知周边物体的运动,与用户进行隔空交互,甚至可以通过感知用户行为来获取用户的一些隐私信息。这些功能大多都是基于智能手机的距离感知实现的。随着科技的进步以及硬件的升级,使得商用智能设备,比如智能手机、移动终端、平板电脑、可穿戴设备等也可以发射和接收超声波信号。超声波可用于感知声源附近的运动,可以让用户在不影响使用的同时得到更好的体验,但是同时也隐
学位
基于图的推荐算法能深入刻画推荐系统中的各类交互信息,其中,图卷积网络类方法因具有强大的特征表征能力而得到了越来越多的关注。推荐系统中普遍存在着异质和同质两类交互信息,已有的图卷积类推荐算法无法做到对两类交互信息的统一利用。此外,在显式评分的推荐系统中评分以边权的形式出现,而现有图卷积网络框架下的推荐系统无法对评分边权加以利用。针对现有图卷积网络类推荐系统中存在的问题,本文研究了如何针对推荐系统的特
学位
空间记忆是日常生活中的必不可少的一项能力。先前的研究已经对空间记忆中的性别差异做了大量的探讨,实验的结果既有“显著性差异”又有“无性别差异”的发现,截至目前为止,针对空间记忆中性别差异而提出的假设仍然不能对所有出现的结果做出解释。本研究中,我们通过分析空间记忆中的性别差异及其与导航能力之间的行为相关性,以此探究导航过程中空间记忆阶段性别差异的产生机制。为此,我们招募了在校大学生作为志愿者,按照指示
学位
图表示学习是指在处理关联性数据时,基于关联性数据中目标间的相互联系与目标自带的特征信息对目标进行特征表示。图表示学习常用来对目标进行端到端的多分类,或下游机器学习任务的展开,如预测、量化目标之间的关联性,目标的类别分类或可视化,以及在目标间进行推理。基于深度学习的图表示学习可以分为两类:半监督图学习主要通过参数化矩阵完成标注信息的传播,而该方法面临的问题之一是参数的过度平滑;无监督图学习基于标签平
学位
实验心理学是通过实验方法对人类的心理和行为规律进行研究的一门心理学科。传统的实验心理学研究大多采用统计学方法进行数据分析,且数据处理基本使用手工或半手工的方式,效率较低。随着计算机的发明与计算机技术的发展,许多交叉研究应运而生,计算机与其他学科的交叉融合改进了传统的研究方法,大大促进了各门学科的发展。  本论文利用计算机技术辅助心理学研究,通过分析被试的眼动数据,探究聋成人和健听成人在视听语音感知
学位
随着计算机图形学、数字图像处理、光学等技术的发展,人们对于显示效果的要求越来越高。真三维显示作为各国大力发展的三维立体显示技术,已经成为了一个重要的科研领域。而体三维显示技术是真三维显示技术中的重要研究方向。国内外已经做了许多有关体三维显示系统的研究,但是当所用于显示计算的三维点云数据中包含横向凹陷区域时,体三维显示系统往往会出现显示问题,无法正确显示出对应凹陷区域的颜色信息,影响显示真实度。  
学位
语言是现实生活中最主要的信息交流方式。语言模型是语言研究中的一项基础工作,能够提供有效的词表征以及词序列的概率化表示,可以应用于语音识别、机器翻译、手写体识别和句法分析等相关研究。目前,语言模型在英语、汉语和日语等语料相对充足语言领域已经取得了比较理想的效果。而针对藏语的相关研究仍处在初级阶段,由于藏语语料资源的匮乏和研究人员的稀少,严重制约了藏语语言模型的研究发展。在此背景下,本文从藏语自身的语
学位
隐式篇章关系识别作为篇章分析中的关键子任务,其旨在推理出篇章内相邻文本跨度(称为论元)之间潜在的语义关系,例如:时序关系、因果关系等。该任务有助于提高情感识别、问答系统、机器翻译和文本挖掘等任务的性能,促进自然语言处理领域中篇章级的基础研究和应用发展。目前,隐式篇章关系识别的方法通常关注于篇章的语义表征,忽略了文本中词汇之间、短语之间、句子之间,甚至与文本关联的深层知识之间的相互影响,不能有效地整