基于上下文门卷积的盲图像修复

来源 :图学学报 | 被引量 : 0次 | 上传用户:keliok
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于深度学习的图像修复方法已经取得较大的进展,目前大多数的图像修复方法都是基于输入的掩模对图像的退化区域进行修复。基于这一观察,提出了两阶段的盲图像修复网络,由掩模预测网络和图像修复网络组成。整个修复过程无需输入掩模,掩模预测网络可以根据输入图像自动检测图像退化区域并生成掩模,图像修复网络根据预测掩模对输入图像的缺失部分进行修复。为了更好地利用全局上下文信息,基于上下文门卷积设计了一个上下文门残差块(CGRB)模块来提取特征信息。另外,还提出了空间注意力残差块(SARB)对远距离图像像素的关系进行建
其他文献
图像情感分析是机器视觉领域的研究热点,它面临的关键问题:标注者的主观差异导致情感标签明确的高质量样本匮乏,且异构图像特征间跨模态语义未有效利用.提出基于主动样本精选与跨模态语义挖掘的图像情感分析模型ASRF2(Active Sample Refinement&Feature Fusion):融合主动学习与样本精选思想,设计主动样本精选策略,优选情感标签明确的样本;对异构图像特征执行判别相关分析,生
期刊
为了解决数字图像灰度信息丢失、边缘模糊导致的图像效果不佳等问题,提出基于卷积神经网络的数字图像模糊增强算法。以图像灰度级作为论域构建特征模糊集合,拟定模糊隶属度,基于模糊熵计算图像边缘灰度值,同时,构建不同光照环境下限制对比度均衡派生图、伽马转换派生图、对数转换派生图、两通道增强派生图,借此微小调整图像像素方差,强化细节信息的表达,增强隶属度,最后通过卷积神经网络筛选图像内渡越点,以此调整图像内对
期刊
图卷积网络由于能够直接处理关节点拓扑图在行为识别方面表现出较好的性能而备受关注,但是这类方法中经常存在长时信息依赖建模能力较弱以及未关注空间语义与时间事件变化不均衡问题,针对这些问题提出基于时域扩张残差网络和双分支结构的人体行为识别方法。在时空行为特征提取方法中不仅用图卷积提取空间域特征,而且用扩张因果卷积和残差连接结构来构建时域扩张残差网络提取时域特征,该网络能够在未大量增加参数的基础上有效扩大
期刊
针对传统三维场景图像表面重建特征点匹配精度不高,计算复杂等实际问题,提出基于虚拟现实技术的三维场景图像表面重建算法。使用小波分解处理图像纹理信息,量化编码图像并把视觉点和图像的间距作为度量值,挑选恰当临界值完成图像压缩,剔除三维场景图像冗余数据;计算图像中的启发式信息,更新信息素矩阵,运用信息素矩阵临界值明确像素点是否为图像边缘点,提取三维场景图像边缘信息;利用虚拟现实设备计算三维场景最小识别距离
期刊
现有多视角图学习方法主要建立在数据具有较好完备性的前提假设下,没有充分的考虑由于特征缺失引起的不完备数据的学习问题.面向这一问题,本文提出一种不完备数据的多视角图学习方法.一方面,从局部视角内将数据重建和图学习放入同一框架,通过不完备数据补偿,实现从重建数据中学习视角专属的近邻关系,弥补特征缺失对数据分布的影响.另一方面,为了保持近邻图的二维结构,引入张量分析,从全局角度构造基于多视角的融合图学习
期刊
脑癌是发病率第二高的儿童癌症,早发现早治疗才能提升患者的存活率。本文提出了基于缩放重构非池化残差胶囊网络和麻雀搜索的MRI脑瘤图像分类方法。首先,针对图像质量差的MRI脑瘤图像,采用基于麻雀搜索的图像增强方法来提升图片质量。其次,采用胶囊网络来解决医疗图像数据量小、数据集不平衡的问题。最后,针对胶囊网络对于大尺寸图像产生的梯度消失和梯度爆炸问题,采用改进的残差网络来提取尺寸较大图片的关键特征。同时
期刊
随着网络平台上各类图像、视频数据的快速增长,多模态情感分析与情绪识别已成为一个日益热门的研究领域.相比于单模态情感分析,多模态情感分析中的模态融合是一个亟待解决的关键问题.本文受到认知科学中情感唤起模型的启发,提出一种能够模拟人类处理多通道输入信息机制的深度情感唤醒网络(Deep Emotional Arousal Network, DEAN),该网络可实现多模态信息的有机融合,既能处理情绪的连贯
期刊
为了在高光谱图像分类中更好提取和表达光谱与空间的精细特征以及特征间的交互信息,提出一种基于多层次空-谱融合网络的高光谱图像分类方法。首先,利用多层次特征提取模块,分别提取高光谱图像的多层次空间和光谱特征;其次,设计空-谱特征交互融合模块将获得的多层次空间与光谱特征进行特征融合,以产生空-谱融合特征。本文方法可以结合网络中不同层次的空间与光谱特征,有效地捕获高光谱图像精细特征;同时通过联合学习融合空
期刊
针对现有的一些三维建模方法强调单一尺度几何模型构建,缺乏多细节层次(Level of Detail, LoD)和语义信息表达,互操作性不强等问题,以国际开放标准CityGML为基础,利用矢量拉伸、基于几何特征和规则的语义信息提取、几何映射和语义映射等技术研究了建筑物多尺度几何语义一体化模型构建方法。采用开源Cesium库开发了一套基于WebGL的建筑物多尺度三维模型可视化系统,通过某大学校园Cit
期刊
孪生网络是当前基于深度神经网络视频实时目标跟踪的重要发展方向,现有研究主要集中在骨干网优化方面,设计及训练均比较复杂。本文提出一种新的思路,通过引入简单且易于实现的传统表观特征,直接与深层语义特征融合,增强了类内目标的区分能力;通过投票机制及自适应搜索模块,增强了算法跟踪的鲁棒性。在VOT系列数据集上的测试结果表明,本文算法相对基准算法在平均重叠期望(EAO)上均有2%-4%的提升,准确性及鲁棒性
期刊