基于概率图模型的场景理解方法研究

来源 :电子科技大学 | 被引量 : 14次 | 上传用户：sun_merry

【摘要】

：

场景理解作为计算机视觉研究领域中极其重要的基础问题和终极目标，其研究成果已广泛应用于机器人导航、安防、医疗、网络搜索等众多民生领域，彰显出重要的学术研究价值和现实意

【作者】

：

毛凌

【出处】

：

电子科技大学

【发表日期】

：

2013年01期

【关键词】

：

场景理解语义分割目标检测联合目标检测和语义分割条件随机场模型

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

场景理解作为计算机视觉研究领域中极其重要的基础问题和终极目标，其研究成果已广泛应用于机器人导航、安防、医疗、网络搜索等众多民生领域，彰显出重要的学术研究价值和现实意义。围绕“分而治之”的指导思想，场景理解的各分支任务，如目标检测、图像分割、场景分类等都已取得了突破性进展。但是整体场景理解的目标远未实现。近些年围绕“合而为一”的指导思想，学者们提出了“语义分割”的研究思路，研究如何将这些分支任务融为一体，以实现场景理解的最终目标，并据此提出“联合目标检测和语义分割”。语义分割不仅在一定程度上实现了对视觉场景的理解，更是推理出其他高层语义的基础；联合目标检测和语义分割则是在完成语义分割的同时，定位到每个物体并获得目标的数量信息。但是目前已有研究成果并不令人满意。因此，本文着眼于目标检测，语义分割，联合目标检测和语义分割等研究热点和难点，采用概率图模型，针对已有研究中的不足开展研究并提出了相应的解决方法。本文主要内容和贡献如下：1．研究了如何构建先进的条件随机场模型，使其准确反映现实视觉场景中的约束条件，从而提升语义分割性能。提出了三种模型：（1）基于扩充纹元图的点对条件随机场模型（下称模型I）。该模型由一元项和成对项组成，其中一元项由联合自举分类器构成，成对项反映了相邻像素间的平滑约束。该模型表达形式简单，简化了模型参数的学习过程。为更好地描述纹理特征，利用LBP、SIFT和Color SIFT等局部特征描述子扩充了原始纹元图；为获得更具区分力的特征表达，在扩充纹元图的基础上定义了纹理空间滤波器，引入了形状、位置和上下文信息，并将其作为联合自举分类器的弱分类器。实验结果表明，该模型得到了较好的语义分割效果。（2）基于全局同主题约束的高阶条件随机场模型（下称模型II）。为了克服模型I自身的局限性，引入了反映全局同主题约束的高阶项，构建出高阶条件随机场模型。首先采用规范化分割对输入图像进行多次分割，其次利用主题模型发现同主题分割块，然后在同主题分割块上定义高阶项，最后与模型I加权混合得到高阶条件随机场模型。该模型不仅考虑了局部纹理特征对于像素类别的约束，而且反映了同主题分割块类别一致性的全局约束，在实验中取得了良好的语义分割效果。（3）融合了像素和分割块两种基本处理单元的分层条件随机场模型。该模型由观察数据层、像素层、分割层三层组成。观察数据层即原始图像；以像素作为基本处理单元的模型I构成像素层，反映了局部纹理特征对于像素类别的约束以及像素间平滑约束；以分割块作为基本处理单元的模型I构成分割层，反映了分割区域的描述特征对于分割块类别的约束、区域一致性约束、以及分割块间平滑性约束。该模型在分割块和块内像素上定义了关联能量项，对两者进行了融合，克服了单独使用一种处理单元的缺陷。本文分别采用了基于多分割图模式和基于约束参数最小割两种方式来获得分割层。此外，本文还提出了一种新的一二阶合并方法来获得更为稳定可靠的分割区域的描述特征。2．提出了一种基于偏最小二乘分析的目标检测方法。首先对输入图像进行多尺度滑窗搜索，通过密集采样获得滑窗的高维特征描述。其次利用偏最小二乘方法从原始高维特征中抽取出少量潜在成分组成低维特征向量空间，从而得到新的目标特征表达。接着提出了一种利用模型质量比值确定最佳潜在成分数量的方法。最后利用基于高斯核的均值漂移算法进行最大值抑制，去除重叠检测边界框，得到最终的目标检测结果。实验结果表明：降维性能优于PCA，能够获得更具区分力的低维特征表达；目标检测性能优于Dalal提出的经典算法。3．提出了一种新的高阶条件随机场模型，以解决联合目标检测与语义分割问题。基本思想是：在模型II的基础上，引入目标检测高阶能量项，将基于目标检测器对搜索窗内像素类别的判断作为一种约束条件反映到能量方程中，与局部纹理特征、像素间平滑先验、分割块内像素类别一致性等约束条件一起“竞争”，共同决定像素的类别归属。此外，提出了两种目标检测能量项生成方法：一是直接利用目标检测器的检测结果生成能量项；二是同时提取边界框中的全局形状特征和局部纹理特征，并通过特征的一二阶合并方法获得更具鲁棒性的特征表达，再利用逻辑斯蒂回归分类器获得更准确的检测信任度，进而获取目标检测能量项。实验结果表明，该模型能够同时完成目标检测和语义分割任务，并且提升了语义分割性能，优于目前许多语义分割算法。

其他文献

新辅助化疗在ⅠB2-ⅡB期宫颈癌治疗中近期疗效研究

目的研究新辅助化疗在ⅠB2-ⅡB期宫颈癌治疗中近期治疗效果，其对临床宫颈癌根治性手术和术后病理不良因素的影响；比较静脉化疗和动脉栓塞化疗两种不同途径新辅助化疗方案在ⅠB2

学位

新辅助化疗宫颈癌动脉栓塞化疗静脉化疗

基于分形与混沌理论的大豆期货市场的特征研究

我国商品期货市场的发展时间较短,只有二十几年,在各方面都处于起步阶段。但即便如此,农产品期货在套期保值和维护市场稳定方面的作用也已经愈发显著。因此,对于金融研究人员

学位

重标极差分析法Hurst指数分形维相空间重构Lyapunov指数

基于聚类的个性化推荐算法研究

随着互联网技术的快速发展，互联网上信息数量成指数级别增长，网络信息的产生速度超过人们能接收的程度，信息过载情况严重，而信息质量参差不齐导致有用信息淹没在信息海洋中。以搜

学位

推荐系统协同过滤聚类

科学本质视野下中美高中物理教材中科学史内容分析

本文选择内容分析法为主要研究方法，梳理了当前HPS教育和科学本质理论研究成果，建立了中美高中物理教材科学史内容对科学本质体现情况的分析框架。本文在已有研究的基础上开发

学位

中美高中物理教材科学本质科学史内容分析

一石激起千层浪——《第一块石头》对女性主义的反思与挑战

《第一块石头》（The First Stone）是当代澳大利亚女作家海伦·加纳（Helen Garner，1942-）的一部“虚构批评式”（ficto—critical）非虚构作品。作者在事实和虚构之闻书写，围绕1991

期刊

海伦·加纳《第一块石头》受害者女性主义后女性主义Helen GarnerThe First Stonevictim feminismpost

我国临床药师工作现状再认识

目的:优化我国临床药师工作模式和方法,使其不断满足现代药学服务的需求,促进我国医疗事业的优化发展。方法:结合我国临床药师实际工作模式和发展现状,借鉴国外临床药师的工

期刊

临床药师医嘱整合团队合作安全用药医院信息系统

影视剧对白中刻意曲解的语用分析

刻意曲解是言语交际中一种特殊的语用策略。在日常交际中,语言使用者有时为了达到某种交际目的,有意歪曲对方的话语意图,以便达到某种交际效果。这种语言现象就是刻意曲解。

学位

语用分析刻意曲解前提条件语用功能

我国矿业管制的法律问题研究

矿业一直以来都担负着为国民经济提供原材料的重任。改革开放以来,矿业部门不断进行市场化改革,引入竞争机制,使矿山企业和地勘单位已经成为独立的法人和经济实体。但是,伴随

学位

矿业管制矿业管制法律问题

温“新”而知“故”——阿特伍德以《珀涅罗珀记》向经典致敬

《珀涅罗珀记》是玛格丽特·阿特伍德对《奥德赛》的重写。本文从标题、人物、背景、叙述声音、结构、语言六个方面对两文本进行对比,进而发现该作品对前驱文本的修正性

期刊

阿特伍德《珀涅罗珀记》经典重写AtwoodThe Penelopiadrewriting classics

饮水中硫酸盐测定方法的探讨

本文就<生活饮用水标准检验法>(GB5750-85)中,硫酸盐的几种测定方法进行了阐述.同时着重对目前国内常用的铬酸钡分光光度法中的冷热两种方法进行了分析探讨.结果表明,冷法操

期刊

硫酸盐分光光度法冷热操作

基于概率图模型的场景理解方法研究

其他学术论文