【摘 要】
:
随着人工智能的发展,场景几何信息的获取,例如深度图像,对高级计算机视觉任务有重要的作用,其被广泛应用于虚拟现实、无人驾驶等领域。目前主流的深度图像获取方法有两种,一种是通过立体匹配算法生成深度图像,这种方法对低纹理和遮挡区域的匹配效果不佳,另一种是通过To F传感器等设备主动感知深度值,这种方法受限于设备成本,获得的深度图像分辨率低且带有噪声。因此,为满足热门视觉任务需求,深度图像增强需求极为迫切
论文部分内容阅读
随着人工智能的发展,场景几何信息的获取,例如深度图像,对高级计算机视觉任务有重要的作用,其被广泛应用于虚拟现实、无人驾驶等领域。目前主流的深度图像获取方法有两种,一种是通过立体匹配算法生成深度图像,这种方法对低纹理和遮挡区域的匹配效果不佳,另一种是通过To F传感器等设备主动感知深度值,这种方法受限于设备成本,获得的深度图像分辨率低且带有噪声。因此,为满足热门视觉任务需求,深度图像增强需求极为迫切。现有研究表明,纹理图像指导的深度图像增强算法在大重建尺度下依然具有鲁棒的性能。本文以高分辨率纹理图像特征为指导,提出基于先验指导的深度图像增强深度模型,主要创新性研究如下。一方面,目前主流模型利用深层的网络结构、优化梯度流和特征重用等方法引入纹理图像指导特征,然而,黑盒式特征提取方式难以保证纹理指导特征的鲁棒性。由于纹理特征和深度特征在梯度域具有更高的相似度,本文提出显式结合梯度特征和纹理特征的深度图像增强模型。该模型采用渐进式上采样结构,在每个上采样阶段,首先由纹理特征指导低分辨率深度特征和梯度特征,然后,深度特征和梯度特征相互融合指导,以充分利用梯度先验。充分的实验证明本文提出的方法与先进模型的性能相比,在客观和主观评估上均有提升。另一方面,现有的主流模型在引入先验指导信息时,往往使用简单的通道维度合并和空间共享卷积核的方式挖掘纹理指导特征。此外,基于单向由粗到细的特征多尺度重构框架,即仅从低分辨率特征逐步重构高分辨率特征,容易在大重建尺度下出现误差累积现象。为解决以上问题,受到传统三边滤波器理论启发,本文设计了一个新颖的联合三边滤波模块,以实现纹理特征和深度特征的自适应融合。为提升模型的效率和泛化性,本文提出学习指导域特征和目标域特征的核生成函数以自适应地生成卷积核,取代直接学习单个卷积核的方式。此外,本文显式引入特征“回看”机制,即高分辨率特征对低分辨率特征的指导作用,其基于联合三边滤波模块的变体,对分辨率不同的跨尺度深度特征进行融合,实现低分辨域和高分辨域特征的双向指导,有效缓解随多尺度特征重构的误差累积效应。在主流合成数据集和真实数据集上进行了充分的实验,证明本文提出的模型与最先进的模型相比,在平衡参数量和复杂度的情况下,指标和视觉结果都有明显提升。
其他文献
由于无线通信技术的迅猛发展,微波技术与设备的研究朝着高性能、小型化、低成本的方向推进,其研发和生产时间也越来越紧迫。为了适应当前技术的发展速度,建立一套高效率、高精度的宽带滤波器设计方法显得尤为重要。本文主要以一款两段级联开路枝节加载的平行耦合线宽带滤波器为研究对象,在近年来国内外宽带滤波器设计研究基础上,运用人工神经网络构建正确的电磁替代模型,进而高效率、高精度地实现该宽带滤波器的尺寸结构设计。
股票市场是一个高波动、非平稳、非线性动态的市场。股票价格波动具有不确定性、高收益、高风险等特点,成为众多投资者所关心和追逐的对象。目前,我国证券市场的研究热点之一是如何提高股票价格趋势预测性能。复杂多变的股票市场提高了投资者对市场分析能力的要求。它不仅要将传统金融理论应用于扩张后的市场,还要与尖端科技相结合。当前最常见的是基本面分析法、技术分析法以及基于统计学、人工智能等相关理论知识的股票预测。相
近年来,深度学习已成为包括医疗健康领域在内的不同应用中的重要研究方法,尤其在心电信号异常检测中,其作用更加凸显。然而,现有的基于深度学习的心电信号分类模型存在网络模型深度大和过拟合的问题,且分类模型的准确率有待提高。为此,本研究结合深度学习,通过引入不同形式的注意力机制进行优化,对心电信号分类方法展开研究,并利用MIT-BIH数据集对其分别进行训练和验证。本文主要研究内容如下:1)心电信号预处理。
算法技术重构了广告业的运作逻辑,微信记录了用户多维度的数据,以用户数据作为推送依据的微信朋友圈广告能实现广告的精准投放。00后青年群体成长于移动互联网时代,但却是各个代际中对广告态度最为消极,对网络隐私的关注程度更高的群体。为何会产生这种现象,哪些因素影响了00后青年的广告态度,是否00后青年群体对隐私的关注与他们的广告态度之间存在关系,成为了值得探讨的问题。本文以传统的认知——情感——行为三阶段
人脑是人体内非常复杂又重要的器官,研究人脑的功能是十分有意义的。视觉信息作为人类认知主要的信息来源,其运行机理一直是脑科学的研究热点。功能磁共振成像(functional Magnetic Resonance Imaging,f MRI)是目前观测人脑活动最主要的研究工具,可以对人脑以较高的时空分辨率进行三维无损成像。针对人脑视觉信息的解码问题,本文主要借助于图卷积网络模型,对人脑在静态图像刺激下
现如今,我国人均国民经济水平与日俱增,人民的生活水平也不断提高。与此同时,人们对汽车的需求量也不断增长,而汽车持有量的大幅增长所带来的首要严峻问题就是交通拥堵,这也对当前的城市发展造成了很大的影响。车辆和行人在道路上必定要经过交叉路口,而交叉路口能够使他们顺畅地通过对整个城市交通的发展也有着长足深远的意义。交通信号控制所针对的对象就是交叉路口,同时,交叉路口也是城市通行能力能否提高的关键所在。目前
随着自然科学的发展和全球信息化的推进,生物医学领域进入了大数据时代。尤其是机器学习方法出现之后,其强大的特征提取能力极大地推动了生物医学数据的研究进程。根据研究变量个数的不同,生物医学数据可分为单变量生物医学数据和多变量生物医学数据。在各类多变量生物医学数据中,脑机接口(Brain-Computer Interface,BCI)技术的研究有助于视听觉受损和肢体运动能力受限的残疾人恢复正常,功能磁共
随着数字图像处理技术和无线通信技术得到高速发展,短视频应用和流媒体平台逐渐兴起,使得人们对视频影像质量的要求日益提高,在许多应用领域中已不容忽视。但是,由于通过升级硬件来提高设备分辨率的代价和局限性较大,数码监测产品常常会在一定程度上牺牲分辨率,从而确保记录装置能够长时间地、稳定地工作,并具有适当的帧率来处理动态情况。在遥感方面,也有相似的情形,比如,在空间、频谱、时间分辨率等方面,都有一定的折中
自从中本聪提出比特币和区块链概念以来,区块链技术得到了广泛关注和发展。区块链具有的防篡改、可追溯和完全去中心化等优点使其具有广阔应用场景,目前已广泛应用于多个领域,如金融、医疗、供应链、政府监管、资产管理等。但是,从事务处理角度看,区块链系统事务处理低下严重阻碍了区块链技术广泛应用。相比于传统数据库系统,区块链系统事务执行缺少并发控制,节点间存在大量事务冗余执行,系统框架上缺乏事务并行执行的设计。
信息化技术的发展给远程医疗和医疗图像共享带来极大的便利,然而,医疗图像作为一种特殊且私密性较强的数字化影像,在公共网络上传输时难免被截获或篡改。患者医疗图像一旦泄露或者遭到恶意的利用和操纵,很容易导致一系列社会性问题。因此,在医疗健康领域,加强医疗图像的安全共享是必不可少的一项工作。区块链技术作为一种新兴的分布式账本,因其去中心化、去信任、不可篡改和可以溯源等特征,已被应用于医疗图像的内容保护与安