【摘 要】
:
图像作为重要的信息载体,广泛存在于我们的生活中。从单个图像中恢复物体的深度次序关系,一直被认为是理解和感知的重要能力。在计算机视觉领域中,图像的深度次序推理基于图像中的遮挡边缘,描述图像中区域或物体间的层次关系,是图像分析和理解的重要基础,是一个基本而具有挑战性的问题,可用于辅助很多高层视觉感知任务,如目标检测/跟踪和运动分析、结构运动和三维重建,自动驾驶,场景理解等。虽然人类可以轻易感知图像中物
论文部分内容阅读
图像作为重要的信息载体,广泛存在于我们的生活中。从单个图像中恢复物体的深度次序关系,一直被认为是理解和感知的重要能力。在计算机视觉领域中,图像的深度次序推理基于图像中的遮挡边缘,描述图像中区域或物体间的层次关系,是图像分析和理解的重要基础,是一个基本而具有挑战性的问题,可用于辅助很多高层视觉感知任务,如目标检测/跟踪和运动分析、结构运动和三维重建,自动驾驶,场景理解等。虽然人类可以轻易感知图像中物体间的深度次序,但是对计算机来说感知图像中的深度次序是很困难的一件事。研究人类的感知能力,人们发现自然图像中的边缘定位影响到计算机视觉感知的不同“等级”。准确地定位遮挡边缘能够有效地帮助计算机像人类一样合理地理解和拆分高级感知任务,更好地从单个图像中恢复物体间的深度次序关系。因此,遮挡边缘提取无疑是图像的深度次序推理中最为基础而关键的一环。目前,深度次序推理中的遮挡边缘提取算法主要有边缘型遮挡边缘提取算法和像素型遮挡边缘提取算法。我们对边缘型遮挡边缘提取算法和像素型遮挡边缘提取网络中的问题进行分析研究,改进现有算法的不足,提出更加准确的遮挡边缘提取算法,来优化深度次序推理结果。本文主要研究成果如下:(1)提出边缘型自适应遮挡边缘提取算法,并将其用于边缘型深度次序推理。首先,我们提出一个自适应DRW超像素分割算法改进分割的自适应性、边界拟合性和边缘形状。我们从自适应种子点初始化,自适应权重衰减函数和形状约束三个方向改进分割结果的质量,使分割结果更加适合遮挡特征提取和遮挡关系判断。其次,为了进一步改善遮挡关系的判定结果,我们从特征和分类器两个层面进行探索与改进。针对现有的特征计算方式,丰富特征并增加对特征不稳定性因素的考量。而对于数据不平衡分类问题,我们提出自适应代价敏感型的自适应AdaCost算法,其中,我们定义了自适应变化的代价项,使其能够动态的调整样本的累积重要性,使得分类器更好的关注少数类的困难样本。接着,我们利用自适应代价调节项去进一步降低累积误分类代价目标函数,并通过放缩得到误差代价上界函数,利用上界函数的逼近解简化分类器的学习和训练过程,更好的进行不平衡遮挡边的分类。最后,基于改进的自适应DRW和AdaCost算法,构建边缘型自适应遮挡边缘提取算法,将其嵌入边缘型深度次序推理地算法框架中,获取最终地深度次序。定性和定量的实验结果表明,我们的自适应DRW和AdaCost在同等的分割和分类算法比较中自适应性和实用性较好,分割和分类性能良好。而结合二者优势的自适应遮挡边缘提取算法也使得深度次序推理结果有明显的提升,充分显示了我们提出的自适应遮挡边缘提取算法的实用性,有效性与创新性。(2)提出新的像素型遮挡边缘提取网络—边缘方向交互的遮挡边缘提取网络(Mutual Boundary-Orientation Occlusion Network,MBOONet),并将其用于像素型深度次序推理。从当前遮挡问题的定义与表示入手,我们首先分析了边缘和方向的辩证关系,重新规划边缘和方向任务的学习,简化遮挡边缘的表示。接着,我们提出边缘方向交互的遮挡边缘提取网络(MBOONet),采用收放型的密集连接方式和递进式补充的多loss监督机制,进一步提高边缘准确性和清晰性,为方向学习提供更加准确的提示。根据边缘和方向的辩证关系,我们以边缘结果为指导信息,引导方向学习,并再次由方向结果恢复边缘结果,保证二者的在遮挡边缘表示上的内在一致性和提高遮挡方向的实用性。最后,我们将像素型遮挡边缘提取网络MBOONet嵌入像素型深度次序推理算法框架,简化深度次序推理任务,并得到最终的输出。我们从定量和定性的角度进行实验验证,分别将我们的MBOONet同当前先进的遮挡边缘提取网络模型在PIOD数据集上,边缘检测结构同HED边缘检测模型在BSDS500数据集上进行对比试验。视觉效果和实验数据进一步证明了本文所提出的遮挡边缘表示的合理性和遮挡边缘提取算法模型的新颖性和有效性。本文通过研究边缘型和像素型遮挡边缘提取算法,为深度次序推理提供了准确的边缘信息。该论文的工作对于场景理解等需要确切感知边缘与相对方位的高级任务视觉问题提供了可行的解决方案和技术路线。
其他文献
G蛋白偶联受体(GPCRs)广泛参与了脊椎动物的生理与病理过程,因而一直是新药发现及研究的最重要靶点。在800多个GPCRs中,孤儿GPCRs是一类内源性配体未知的GPCRs,被认为是药物研发的潜在靶点。因此,鉴定其内源性配体进行去孤儿化具有重要的临床意义,广泛受到学者的关注。然而,越来越多研究证明GPCR(包括一些孤儿的受体),可以配体非依赖的形式组成型的激活G蛋白信号。G蛋白偶联受体39(GP
中国政府一贯鼓励跨文化交流,积极支持中外双方合作办好孔子学院。目前,孔子学院已经成为中国的一张世界名片,国际影响力显著提升。作为“一带一路”沿线的重要国家,泰国的孔子学院在全球范围内发展较为成熟。泰国玛哈沙拉卡坎大学孔子学院地处经济文化相对落后的泰国东北部地区,是全球占地面积最大、汉语志愿者教师人数最多的孔子学院,为泰东北地区的汉语推广以及中国文化传播事业做出了巨大的贡献,但它在全球范围内的知名度
目的:探讨黄芩素对顺铂诱导胃黏膜损伤的保护作用,并阐明其可能的作用机制,为今后黄芩素在临床上的应用,尤其是减轻顺铂的胃肠道副作用提供必要的的理论基础和实验依据。材料
近年来,随着设备小型化技术的快速发展,分布式探测集群已经被大量应用于实时目标识别等场景之中。但是,随着应用的深入,逐渐产生以下问题。受到单个节点探测精度的限制,分布式探测集群中单一节点在进行目标识别时,只能获取到有关目标的低特征维度知识,此类知识中往往会包含较多的干扰目标。同时,由于分布式探测集群去中心化的特点,集群每个节点所获取的知识均会直接上传给上层用户。大量包含干扰目标的知识同时向上层用户发
在国民经济中,中小企业正发挥着越来越重要的作用。一方面,中小企业为GDP的增长做出了重要贡献;另一方面,中小企业数量众多,解决了很大部分的国民就业问题,帮助缓解了许多的
随着互联网的逐渐普及和发展,互联网用户数量与日俱增。互联网中每天都会产生海量且多种多样的文本资源,其中蕴含丰富的信息,包括重要的地理位置信息。如何提取这些海量文本中的地理信息,以及分析和挖掘文本资源和地理信息之间的关系,是当今科学研究的热门方向之一。传统互联网是基于网址进行整合的,而将网页文本中的位置信息提取出来,重新整合,形成文本到地理位置的映射,对于研究并提出位置服务的创新模式,建立和发展新一
随着我国设施农业的飞速发展,虽其集约化程度很高,但因我国水资源分布的不均衡性,仍对节水灌溉有较高的经济要求。本研究以设施温室番茄生产为基础,从番茄幼苗生长发育所需水分的角度出发,深入研究分析番茄幼苗期对土壤水分含量的需求,最终使设施温室番茄灌溉的植物水分需求与经济性二者兼顾。本次实验以辽园多丽番茄为实验植物样本,在沈阳农业大学信息与电气工程学院农业生物信息智能检测研究所内,进行了基于叶绿素荧光成像
随着互联网技术的快速发展以及网络用户规模的爆发式增长,产生了众包这种通过群体智慧来解决问题的新兴模式。这为传统软件开发方式带来了新的机遇,软件开发不再局限于小型、孤立的开发者社区。相反,越来越多的人正在使用众包平台来竞争完成软件开发任务。这种跨越时间和地理限制的新兴开发方式已经成为一种强有力且被人们接受的软件工程新方法—软件众包。近年来,软件众包应用不断增长,以Topcoder和开源众包平台为代表
酸土脂环酸芽孢杆菌(Alicyclobacillus acidoterrestris)作为一种嗜酸耐热菌,不仅可以在巴氏杀菌过程中存活下来,还可以在酸性苹果汁中生长繁殖,给苹果汁行业带来了严峻的挑战。本文探索了运用聚偏氟乙烯微滤膜去除苹果汁中酸土脂环酸芽孢杆菌,并采用聚多巴胺涂覆和nisin接枝,对聚偏氟乙烯微滤膜进行改性,进一步提升其除菌性能,取得了以下主要结果:1.利用不同孔径的聚偏氟乙烯微滤
在我国社会经济快速发展的大背景下,人们对铁路出行的需求不断增加。列车运行控制系统作为保障列车运行安全和提高运输效率的关键,其研究受到越来越多的关注。在传统“地面集中式”列控系统中,地面设备几乎承担了所有核心功能,因而导致了一些问题。基于车-车通信的新型列控系统作为解决办法之一,大量简化地面设备,并将传统地面联锁转移至车载,实现了列车自主控制运行。与传统联锁系统不同,新型车载联锁采用基于“车-车通信