【摘 要】
:
人工智能的浪潮席卷世界,多媒体应用融入了人们的日常生活,人脸支付、线上购物、网络直播等已经成为生活中密不可分的环节。多媒体数据中,人物图像内容感知是以人为核心的相关应用的基础,它对视频监控、自动驾驶、虚拟购物等实际应用有重要的支撑作用,因此研究人物图像内容感知具有重要的理论意义和应用价值。本文主要研究人像内容中两种不同粒度的语义信息感知,即粗粒度的衣服属性和细粒度的人体部件类别,实现人物图像内容全
论文部分内容阅读
人工智能的浪潮席卷世界,多媒体应用融入了人们的日常生活,人脸支付、线上购物、网络直播等已经成为生活中密不可分的环节。多媒体数据中,人物图像内容感知是以人为核心的相关应用的基础,它对视频监控、自动驾驶、虚拟购物等实际应用有重要的支撑作用,因此研究人物图像内容感知具有重要的理论意义和应用价值。本文主要研究人像内容中两种不同粒度的语义信息感知,即粗粒度的衣服属性和细粒度的人体部件类别,实现人物图像内容全局和局部语义信息的整体解析。特征提取是人物图像内容感知的关键,鲁棒的特征对图像内容的识别起至关重要的作用。基于此,本文深入分析和挖掘空间特征表达存在的瓶颈,重点研究如何探索空间位置与语义类别之间的关联关系提取鲁棒的特征表达,以提升人像内容感知的能力。针对特征提取中存在的依赖大量手工数据标注、空间特征表达能力受限、实际场景内容复杂多变等难点进行了深入研究,主要成果是围绕空间语义关联性提升了衣服属性和人体部件类别语义信息的识别能力。具体地,本论文主要创新点包括以下四个方面。1.针对当前深度学习模型依赖大量人工标注数据的问题,提出了一种无监督模型辅助衣服属性识别的方法,通过挖掘无监督衣服视频的空间和语义线索,设计了一个三元组框架预训练鲁棒的无监督网络,并将无监督学习到的衣服知识迁移到有监督的衣服图像属性识别。实验验证了利用视频上下文信息可有效减少人工标注的负担。2.针对当前衣服属性识别任务中缺乏挖掘特定衣服属性和空间位置之间的关系问题,提出引入注意力模型来解决衣服属性识别问题,若直接采用经典的空间注意力机制学习每个任务的注意力权重,会遗漏不同任务之间的相互影响。为了突破此局限,提出了一种任务感知注意力模型,可以在每个空间位置有效估计跨越不同任务的重要性,此外还构建了一个无监督归一化模型来挖掘同一空间位置对不同任务的重要性,避免了额外的人工标注。在商店域和街道域场景的衣服属性识别实验结果验证了任务感知注意力机制的有效性,并且从可视化的注意力热图来看,本文提出的任务感知注意力模型可以很好地捕捉到不同属性对应的空间区域。3.针对空间池化金字塔模块中的平均池化基本单元不能很好地探索与任务相关的上下文信息的问题,提出了一种能够自适应地聚合来自不同人像语义类别空间位置线索的聚集-激励方法。此外,为了解决人像语义解析任务中的尺度不一和类别易混淆的问题,构建了聚集激励上下文金字塔模块(PGEC),能够探索更丰富的局部和全局上下文信息,从而有效解析多尺度的人体部件。单人和多人人像语义解析实验结果验证了PGEC均能够取得领先的分割性能,且PGEC在人像语义解析任务中优于空间池化金字塔(PSP)和空洞空间池化金字塔(ASPP)。4.针对基于锚框的人物检测器存在的超参敏感性边界框设计和非像素级导向设计两个问题,提出了一种新的免锚框的实例人像语义解析模型,通过引入面向像素级设计的免锚框人物目标检测器,有效避免了超参数敏感性问题。此外,针对实例人像语义解析中边界易混淆的问题,设计了一种边缘线索引导的人像语义解析模块,有效区分不同人物实例位置和相邻人像语义类别区域。实验验证了在多人实例人像解析数据集上能够取得较好的人像语义分割性能,尤其是在实例级的评价指标上效果更加凸出。
其他文献
数字全息显微技术具有非接触测量、大视场范围、实时性好的特点,因而在微纳米结构的表面形貌测量方向和生物医学测量方向有着广阔的应用前景。微纳制造技术和生物医学研究技术的进步,对数字全息显微术的发展提出了高分辨力、高相位质量和高相位准确度的要求,这成为了数字全息显微术发展道路上的新挑战。本文围绕数字全息显微技术中相位质量提升方面开展研究,进行了校正多角度照明超分辨数字全息术的相位、提高测量浑浊介质中样品
双频超声传感器在参量阵技术、超声谐波成像以及一些新兴生物医学领域中具有广阔的应用前景。基于MEMS工艺的双频电容式微机械超声传感器(Capacitive Micromachined Ultrasonic Transducer,CMUT)因频率控制灵活、易于加工阵列、阵元一致性好、方便与CMOS电路集成等优势而具有重要研究价值,但现有的双频CMUT研究主要针对医学超声成像方面的应用。由于CMUT声阻
多媒体阅读形式不断发展,正逐渐取代了传统的阅读方式。大型的公共阅览室是现代主要的阅读场所,而其中的光照质量对读者的视力,提高阅读效率,为读者创造良好的阅读环境具有极其重要的作用。因此迫切地需要我们开展针对不同形式的阅读特点的光照环境进行相关节能研究。利用多目标优化方法提升图书馆室内照明质量,具有很强的科学性与现实意义。通过对全国多个图书馆展开实地调研,设立了主观评价实验,得到影响舒适性的光环境因素
地震是最具毁灭性的自然灾害之一,了解震源过程对于地震预测及防震减灾具有重要的意义。目前,人们对震源过程已经取得了较为全面的认识,揭示了地震是破裂在断层面上开始、传播和终止的过程。然而,关于震源过程的一些细节和机理仍然存在争议。为了厘清控制震源过程的物理机制,对震源过程获得更加深入的认识,我们基于实验室地震研究方法探究震源过程的一般规律及其机理。本文基于PMMA材料开展实验室地震研究,采用双轴加载方
随着社会的发展,企业发展理念也出现了一些变化,新形势下,企业更加注重自身发展的科学性,关心自身发展是否符合行业的发展趋势,因此,在企业发展的过程中更加注重企业文化的建设,以期能够保证企业具备较强的核心凝聚力,塑造良好的企业形象。企业文化建设的基础是职工,企业在以职工为基础进行企业文化建设时应积极开展职工文化活动,以便企业在文化建设的过程中加强对职工的思想及能力的影响,为企业发展提供源源不断的动力。
海底管道是海上油气集输和储运的关键环节,随时面临着海洋环境与人类活动等多方安全挑战,开展风险评估是保障管道安全的重要技术和管理手段。本文针对海底管道风险评估中精确数据缺失和评估不确定性等问题,开展了不同评估偏重和应用场景下的评估方法研究,旨在提高风险评估结果的可靠性,为海底管道安全风险管理提供有效的理论工具。主要研究内容如下:(1)针对海底管道失效概率分析中基础数据不足和专家判断的不确定性问题,建
提高国内油气产量是缓解中国日益严峻的能源形势的重要举措。由于含油(气)量不同的油气储层对外表现的地层电导率不同,人们将地层物理参数之一的电导率作为油气储层性质评价和剩余油气识别的重要依据,对其进行探测有助于实现油气的稳产、增产。套管井的钢套管使得地层电导率的探测非常困难。现有方法利用推靠到套管内壁的电极系测量套管上纳伏级的直流电压降,获得地层电导率。该方法只能单点探测,时间长、效率低,而且对井筒条
渤海油田是我国海洋石油的主产区。但受到油田开发成本的限制,渤海中很多小型的边际油田没有得到有效开发,因此降本增效是提高小型油田收益率的主要途径之一。在海洋石油开采过程中,井口结构必不可少,通常由钢质隔水导管和表层套管与固井水泥组合而成,其直径和入泥深度均与钢管桩相近,因此如能利用井口结构承担上部荷载,替代或部分替代传统导管架平台的钢管桩基础,则可降低海洋平台的建造成本。本文将由隔水导管、表层套管与
利用连续波多普勒雷达监测生命体征(即呼吸和心跳)无需接触人体,且对温度、光照等环境因素不敏感,因此其在特殊患者的长期监护、家庭健康监测、灾后救援、安防、军事等领域都具有非常大的应用潜力。但即使连续波多普勒雷达与测试者之间无任何阻挡物,该监测技术也面临一些困难与挑战。首先,在呼吸谐波的干扰下,当测量距离大于等于1 m时,要实现心率的平均测量误差低于1%依然存在困难,但是为了在更加逼近真实监护场景的情