【摘 要】
:
深度估计是经典的计算机视觉任务之一,它可以为对象和环境提供丰富的表示信息。近年来,端到端深度估计方法的性能已得到显著改善。但是,卷积和池化操作的堆叠导致局部空间细节信息丢失,这些信息对基于监督学习的单目深度估计非常重要。为了克服这个问题,本文首先提出一种具有跳跃连接的编码器-解码器框架。基于自注意力机制,将通道空间注意力模块作为过渡层,捕获深度和空间位置关系,提高通道和空间的特征表示能力。然后提出
论文部分内容阅读
深度估计是经典的计算机视觉任务之一,它可以为对象和环境提供丰富的表示信息。近年来,端到端深度估计方法的性能已得到显著改善。但是,卷积和池化操作的堆叠导致局部空间细节信息丢失,这些信息对基于监督学习的单目深度估计非常重要。为了克服这个问题,本文首先提出一种具有跳跃连接的编码器-解码器框架。基于自注意力机制,将通道空间注意力模块作为过渡层,捕获深度和空间位置关系,提高通道和空间的特征表示能力。然后提出密集解码模块,以在解码过程中充分利用不同尺度范围的注意力特征。它在获得多尺度信息的同时,实现更庞大和更密集的感受野。最后,引入一种新颖的距离感知损失函数,以预测不同距离物体更细致的边缘和局部细节。在自监督学习单目图像深度估计算法中,深度不连续性和运动对象的伪像仍然是具有挑战性的问题。现有的自监督方法通常利用两张视图训练深度估计网络,并使用一张视图进行预测。与静态视图相比,视频帧之间的丰富动态特性有利于细化深度估计,尤其是对于动态对象。在这项工作中,使用单目和立体声视频的连续帧训练和测试算法,并改进深度估计的自监督学习框架。主要思想是利用隐式深度线索提取器提取动态和静态线索以生成有用的深度特征建议。这些线索可以预测可区分的运动轮廓和几何场景结构。此外,提出一种新颖的高维注意力模块提取清晰的全局相机变换,从而有效地抑制高维空间中局部描述符的不确定性,使得学习框架实现更可靠的优化。实验表明,所提出的监督/自监督框架在NYU v2,KITTI和Make3D数据集上优于最新技术。
其他文献
土-结构相互作用(SSI)对结构地震响应有明显的影响。为研究SSI效应对核电结构的影响,选取第三代核反应堆AP1000安全壳结构为研究对象,制作了1/40的安全壳模型进行振动台试验,采用柔性土箱消除边界效应。试验结果表明:1)对于核电非隔震结构,考虑SSI会降低系统自振频率,上部结构加速度反应谱高频成分减少,峰值频率从高频向低频移动,土体表现出一定的隔震效果,降低了某些频率处的加速度谱响应;2)对
<正> 目前国内外对苦豆子的研究及其应用,均着重在生物碱上。在人医界已有不少报道。如中国人民解放军第四军医大学用苦豆碱和槐果碱治疗人的急性菌痢,并以痢特灵加黄连素作对照,获得了满意效果。宁夏卫生防疫站用苦豆草片防治人的急性菌痢,结果经统计学处理,观察组与对照组差
为研究某博物馆隔减震联合方案,对采用橡胶隔震支座基础和上部屈曲约束支撑的结构进行了1/30缩尺模型的地震模拟振动台试验。试验研究表明:在各水准地震作用后,联合隔减震结构仅出现轻微损伤,在设防地震后Y向第一平动自振频率降低了9.1%,罕遇地震后第一扭转自振频率降低了6.1%;加速度放大系数在隔震层为0.45,上部结构也均小于1.0;随着地震作用的增加隔震支座的耗能表现越来越好,从多遇地震下耗能仅约4
随着计算机图形学和虚拟现实的不断发展,听觉渲染技术逐渐引起人们的重视。目前对于火焰和水的声音合成研究都有了很大的进展,而有关气体的声音合成研究还比较少。本文针对此问题中的常见场景——旋转叶片声,包括考虑可变形固体叶片材质声音的旋转叶片声进行了研究。首先,本文针对旋转叶片声提出了一种基于物理引导的合成方法。本文关注于在现实世界和计算机游戏中都很常见的旋转叶片(例如风扇、直升机和风力机)的声音合成。首
局部放电现象通常是高压电力线路及设备发生严重故障前会出现的一种现象。在现实的高压电力设备及线路的检测过程中,通常使用的是传统的物理方法,比如根据其物理特征进行判断。但是,并不是所有环境都方便进行人工检测。其次,还需要检测人员具有较为丰富的经验,以应对不同线材及设备的检测。因此,一种高效、准确且通用的局部放电现象检测方法对于提升电力网络系统的长期稳定运行能力具有重要意义。本文针对这一问题提出了三种方
<正>思辨读写指的是将搜集资料、辨析问题、质疑探究、反思评估等结合在一起展开的读写活动。传统的读写结合活动常常只是关注让学生把握住文本的语言特点和表现手法,并在此基础上仿写,但是思辨读写则不一样,它强调的是学生在阅读过程中思考、辨析的过程,能很好地提升大家的思维水平。在小学语文教学中,教师也可以将整本书阅读和写作结合在一起,
<正>陈敏仪,女,汉族,1990年10月出生,中共党员,广东省东莞市残疾人体育训练中心运动员。她练习射箭10年,在2021年东京残奥会射箭项目女子W1级复合弓个人赛中,以142:131战胜捷克选手,获得冠军,并打破残奥会纪录,同时还在复合弓W1级混合团体赛中夺得金牌。
[目的]分析腰椎椎间融合术神经损伤的独立危险因素,为预防术后神经并发症提供参考。[方法]回顾性分析2015年9月—2020年6月本院采用后路腰椎椎体间融合术(posterior lumbar interbody fusion, PLIF)或经椎间孔入路腰椎椎体间融合术(transforaminal lumbar interbody fusion, TLIF)治疗腰椎退行性疾病(lumbar deg
图表征学习是处理图数据的重要手段,近年来将卷积神经网络(Convolutional Neural Networks,CNN)运到图表征学习中提出的图卷积神经网络(Graph Convolutional Network,GCN)及其变体在对图数据的处理分析中取得了巨大成功。然而,三个根本性的缺陷限制了他们对图数据的表征能力,分别是过平滑现象、无法捕捉长程依赖和未标注数据利用率低。为了解决GCNs(G
网络嵌入旨在学习网络中节点的低维表征,以支持后续的网络分析任务,例如节点分类、节点聚类、链接预测和可视化。最近已经提出了一些优秀的网络嵌入方法,其中最为突出的是基于生成对抗网络的嵌入方法。现有的基于生成对抗网络的方法都是对表征结果进行对抗训练,也就是迫使表征符合某一特定分布,一般采用高斯分布。然而,这种策略很难将表征与高斯噪声区分开,因为其要求表征服从高斯分布,这大致等于给表征添加了一个高斯正则项