表观模型和决策模型下的视觉追踪算法研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:a27155908
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
视觉目标追踪是计算机视觉领域的一项基础性研究,其应用场景包括自动驾驶、人机交互、智能视频处理等。尽管对于视觉目标追踪的研究已经取得了很大的进展,但它仍是一个颇具挑战性的问题。其挑战性在于如何依据目标的一个初始状态,来估计后续视频帧中会发生各种变化的目标的状态。本文结合追踪任务的特性,按照先在线信息挖掘和应用后离线先验信息应用的研究路线,从追踪框架的表观模型和决策模型着手,对以下四个问题进行了研究。首先,有效表征各种变化的表观模型的构建问题。目标的表观模型既需要能够识别发生变化的目标,又需要区分目标和与目标相似的背景物体。其次,追踪中的遮挡问题。目标遮挡是追踪场景中常见且容易导致追踪失败的一个问题。再次,在线模型更新中的误差累积问题。在线更新能够对目标新出现的状态进行建模,从而有助于实现对于目标的长期、稳定的追踪。然而在线更新容易带来误差累积问题,进而导致追踪的失败。最后,序列信息在深度学习框架中的应用问题。直接将检测模型用于追踪任务虽然取得了一定的效果提升,但是追踪任务所特有的序列信息没有被有效利用。针对上述四个问题,本文从表观模型和决策模型入手,按照在线信息和离线先验信息挖掘和应用的思路进行了研究。本文的研究内容包含以下五个部分:
  (1)针对单一特征无法有效表征发生多种变化的目标的问题,提出一种基于最小化相对熵的多特征表观模型,提升追踪算法的鲁棒性。该方法研究通过联合多种具有互补性的特征,构建了一个更加鲁棒的特征模型;通过最小化相对熵的多视角学习模型,来为确保多特征融合的有效性。在实验设计上,该模型使用能够解决形变、旋转问题的颜色直方图特征和能够解决光照变化、尺寸变化的Histogram of Oriented Gradient(HOG)特征以及灰度特征来构建多特征模型。不同于常见的多特征融合方法,该部分研究选择了具有互补性的特征,并且提出了一种有效的基于多视角学习的融合机制。通过消融实验分析和与多种算法的实验对比,验证了其在多个数据集上的性能,并论证其在追踪算法鲁棒性方面的提升效果。
  (2)针对预训练分类网络的深度特征存在的信息冗余、空间信息不足的问题,提出了一种具有目标感知能力的追踪算法。该算法以卷积神经网络反向传播的梯度作为指导信息,从预训练的分类卷积网络中生成能更有效表征目标和对目标尺寸变化敏感的特征;通过分别构建一个岭回归损失和一个排序损失,来获取对目标有强烈响应的特征和对目标尺寸变化敏感的特征。在实验方面,通过可视化对比原始特征和生成特征,论证了生成模型的性能和效果;通过详细的消融实验分析,验证了各个模块的有效性;与其它方法的比较,展示了其在运行速度和追踪精度方面的性能。
  (3)针对遮挡的产生规律,提出了一种基于多实例学习思想和支持向量机分类器的遮挡检测模型;并在遮挡过程的不同阶段,调整生成模型和判别模型的权重,来联合地使用这两种模型的优势进行追踪。该方法在遮挡发生初始阶段,通过生成模型来对局部遮挡的目标进行准确定位;在遮挡消失阶段,判别模型能够检测出从遮挡中恢复的目标,从而防止追踪漂移问题的发生。通过在多个含有大量遮挡序列上的评测,展示了所提方法在解决遮挡问题方面的效果;并与其他方法在多个测试序列上进行对比,验证该方法的适用范围。
  (4)针对在线更新中噪音样本所带来的误差累积问题,构建一种基于双边界分类器的决策模型。该模型通过建模同一目标不同表观的区别,来感知目标的表观特征变化;通过建模目标与背景样本之间的区别,来抵抗背景干扰物的影响。在线更新阶段,双边界模型通过捕捉目标新出现的表观特征,并且去除冗余的目标样本和含有噪音的目标样本,为在线更新模型提供准确、具有丰富表观特征的训练样本。这抑制了在线更新中的误差累积问题,提高了在新更新的效率。该部分研究在孪生网络框架下,利用双边界模型生成的模板集,实现了对变化目标的有效追踪。通过消融实验分析和与其他方法的对比试验,验证了该方法各个模块的有效性以及其对在线更新效果的提升。
  (5)针对基于检测的深度追踪框架没有使用追踪序列信息的问题,提出一种基于最大后验目标状态估计的自适应Region Proposal Network(RPN)决策模型。该模型通过一个基于孪生网络的目标状态观测模型来生成对当前目标状态的观测;利用最大后验概率来估计目标的真实状态;并根据估计的目标状态,对RPN模型中的锚框和特征模型进行相应的调整,使其能够更有效地服务于目标的识别和定位。在实验方面,交叉实验对比验证了各个模块的有效性;与其它方法以及基于检测的追踪方法的对比,验证了该方法在利用序列信息方面的有效性。
其他文献
钙激活氯离子通道(CaCCs)首先在非洲爪蟾卵母细胞中被发现,CaCCs对阻断多精症有很重要的作用。研究已证明TMEM16A作为CaCCs的分子基础。TMEM16A可以被钙离子激活,TMEM16A电流具有钙离子依赖性、电压依赖性激活特性和外向整流特性。TMEM16A广泛分布于上皮细胞、嗅觉感觉神经元、痛觉神经元、气管平滑肌细胞、血管平滑肌细胞、胃肠道间质细胞。TMEM16A的表达与多种疾病的发展进
学位
辐射诱变育种因具有高突变率、高存活率、宽突变谱、稳定快等特点已经得到广泛应用,但大多辐射诱变育种研究还停留在诱变植株表观性状的观测及有益突变体的筛选上,对引起突变的分子生物学研究较为滞后。光对植物的生长、形态建成、物质代谢、基因表达等均有调控作用,光敏色素感受光信号并不断地对植物生理和发育过程进行光特异性调节。将辐照与光质双重因素协调作用于诱变育种的研究鲜有报道。这些已成为进一步培育优质植物新品种
组织蛋白酶cathepsinD(cathD)是普遍存在于真核细胞溶酶体中的天冬氨酸蛋白水解酶,在溶酶体的酸性环境下发挥剪切底物降解蛋白的功能。但在本研究中,我们发现cathD还具有非传统蛋白酶活性的新功能。与其经典的在酸性环境中降解蛋白的蛋白水解酶活性不同,在中性环境中,cathD可以作为一种新型的磷酸酶,通过去磷酸化丝切蛋白cofilin参与调控细胞微丝骨架的重组。通过免疫蛋白印迹和免疫荧光化学
脊椎动物脊髓内的神经网络是中枢神经系统控制身体动作和行为的重要组成部分。V2居间神经元是脊椎动物脊髓腹侧运动神经网络内的一类将脑部信号转换为协调的身体动作和控制运动速率至关重要的神经元。V2居间神经元发生部位,发育过程和分化类型在脊椎动物中是保守的。在所有脊椎动物中,V2居间神经元都包含激活型V2a和抑制型V2b居间神经元两个亚类。V2a和V2b在分子特征和功能上都不同,但都是由神经管腹侧的P2前
学位
当前,癌症依旧严重威胁着人类健康。据2015年世界卫生组织对全球172个国家人口死因的数据统计,癌症是其中91个国家人口过早死亡(70岁前)的首要或次要原因,是另外22个国家人口过早死亡的第三或第四原因。2018年,结肠癌成为全球发病率排行第四,致死率排行第五的癌症。  许多肿瘤细胞,即使是在氧气充足的条件下,也会优先通过糖酵解途径,而不是经线粒体三羧酸(Tricarboxylic acid,TC
学位
背景:  肺癌是对人类健康和生命威胁最大的恶性肿瘤之一,其每年的发病率和死亡率在所有类型的癌症中是增长最快,且呈逐年上升趋势。人类基因组中98%以上的基因属于非编码RNA(non-codingRNA,ncRNA)。LncRNA是一种至少拥有200个核苷酸的一种不编码蛋白质的RNA。大量研究表明,肿瘤的形成和演进和lncRNA的异常表达有密切的关系。LncRNA的表达在肿瘤组织和细胞中相对于正常的组
学位
植物叶片衰老是一个受到严格遗传调控的程序性细胞死亡过程,受到各种內源信号和环境刺激的影响。丝裂原活化蛋白激酶(Mitogen Activated Protein Kinase, MAPK)级联是真核生物中高度保守的信号通路。在拟南芥中,两个功能高度冗余的MAPKs(MPK3和MPK6)及其上游两个功能也高度冗余的MAPKKs(MKK4和MKK5)组成一条信号级联,在植物生长发育以及免疫反应等生物学
学位
自噬是真核细胞中高度保守的依赖于溶酶体的一种降解途径,能够降解细胞内异常聚集的蛋白以及细胞内受损的细胞器。自噬的异常和人类许多疾病的发生密切相关,如:神经退行性疾病,代谢类疾病及肿瘤等。自噬的发生过程主要分为四个阶段:自噬的起始,自噬体的延伸与闭合,自噬体和溶酶体的融合,自噬底物的降解。这些过程由一系列自噬相关蛋白参与,并受到细胞内自噬诱导信号的调控。近年来研究发现,自噬相关蛋白受到乙酰化修饰的调
目的:本次研究主要利用CRISPR/Cas9基因编辑技术在体外建立SCN1A基因稳定敲除的细胞系并采用RNA-seq分析细胞的基因表达谱的变化。通过检测mRNA水平的变化分析SCN1A与DS发病之间的关联,并希望为Dravet综合症的治疗提供一些线索。  方法:①根据SCN1A启动子区序列设计sgRNA,并构建CRISPR/Cas9敲除质粒(pX459-SCN1A)。②将pX459-SCN1A质粒
学位
随着互联网的普及,人们之间的交流可以通过语音视频等更为直观和更具表现力的方式实现。未来随着5G技术的推进,网络、车载视频、安防和体育录像都将出现井喷式增长,这使得视频内容理解和处理工作面临着巨大挑战。  本文便是在这一研究背景下,期望对复杂视频的内容进行缩减,实现紧凑表达,以促进相关工作的进展。视频内部存在没有效力的视频帧或者片段,而传统方法对视频进行全局描述并未考虑到这种差异。视频紧凑表达的目标