【摘 要】
:
当今时代,人们追求更佳的视觉体验和更丰富的信息,现有的灰度图像着色算法可分为基于用户引导的颜色传播类算法、基于参考信息的半自动着色算法和基于数据和算力驱动的自动图像着色算法。前两种算法由于其本身的特点,而受限于使用场景和规模程度,第三类算法是顺应时代发展的产物,结合人工智能算法的研究进展、图像显卡设备的性能突破和大数据时代的到来,基于深度学习的灰度图像自动着色算法表现优异,从众多方法研究中脱颖而出
论文部分内容阅读
当今时代,人们追求更佳的视觉体验和更丰富的信息,现有的灰度图像着色算法可分为基于用户引导的颜色传播类算法、基于参考信息的半自动着色算法和基于数据和算力驱动的自动图像着色算法。前两种算法由于其本身的特点,而受限于使用场景和规模程度,第三类算法是顺应时代发展的产物,结合人工智能算法的研究进展、图像显卡设备的性能突破和大数据时代的到来,基于深度学习的灰度图像自动着色算法表现优异,从众多方法研究中脱颖而出。该类方法不需要用户交互,属于端对端的模型,此类方法使用卷积神经网络搭建不同的网络架构,通过激活函数得到非线性模型,提高模型学习能力,输入大量数据训练,让模型学习灰度图与彩色图之间的颜色映射。本文采用深度学习架构,对灰度图像自动着色算法进行了研究,具体内容如下:1、基于WGAN-div训练策略构建神经网络并训练一个端到端的深度学习模型,在特征提取阶段引入改进的残差思想和双路注意力网络,减少层级信息传输损失,提高信息提取率。通过空间域的注意力机制,使得long-range的像素点也能建立联系,实现像素级别的颜色预测;通过通道域的注意力机制,对不同重要程度的特征分配不同的权重。通过实验证明本文算法与现有优秀算法相比,可得到整体着色效果优异,细节分明、纹理清晰且更加自然的彩色图像。2、为得到更强的学习能力,将网络层数扩展为原来的两倍,再引入相同网络结构的前景语义信息提取网络,设计了一个分两阶段训练的网络架构。实验结果表明,在引入第一阶段训练得到的前景语义信息后,在主观上可有效改善视觉中心区域着色中的色泽暗淡、细节丢失、对比度低等问题,取得了更好的图像质量;在客观指标上,本文算法在两个数据集上的峰值信噪比分别高出2.59d B和3.54d B,感知相似度分别降低0.01和0.02。3、对检测前景数量、色彩空间和颜色提示信息这三个影响因素进行了对比实验,并分析它们对着色效果产生的影响;在黑白照片数据集和胃癌数字病理切片数据集上,进行本文算法的推广应用实验,用于复原老旧照片和增强数字病理切片图像的染色。
其他文献
视频压缩技术已显著节约了视频的存储空间和传输带宽,但过度压缩会不可避免地导致压缩效应的出现。实验表明,相关压缩效应的存在显著降低了视频的画质,并严重影响了终端用户的观看体验。为解决此问题,需探讨压缩效应与视频质量之间的相关性,并以此为基础,构建压缩视频质量的客观评价指标。其中,无参考的质量评价方法更加切合于用户端的观看环境,也因此成为当前研究的重点与难点。就此,本文定性研究了压缩效应与视频质量之间
现如今虚拟现实技术发展显著且应用度广,全景视频作为其中的一种技术在虚拟现实研究中占据重要地位。全景视频是把全景和视频相结合的一门综合技术。与传统视频的单一视角对比,全景视频能够提供宽广的视野,还可以观看任意方向的内容,有良好的沉浸感和使用价值。现如今直播的盛行,全景视频在娱乐、旅游、交通等方面都得到了一定程度的应用。将全景视频与直播相结合,实现全景视频直播,势必将成为今后社会的一大热门。实时性和画
对于多媒体服务而言,触觉感知愈发重要。触觉感知融合音频和视频,可以构建更具沉浸式的多媒体用户体验。随着触觉感知需求及相关软硬件交互设备的发展,需要传输的触觉数据规模越来越大。为支撑媒体流的传输和触觉感知信号的再现,触觉感知编解码技术显得尤为必要。但现阶段触觉感知信号的研究还未达到较高水平,特别是该领域的编解码方案压缩性能有限。为解决该问题,本文分析了动觉信号,即触觉感知信号的两种主要类型之一,发现
伴随着科技的进步,医疗环境的改善,肺癌的死亡率和发病率都有所下降,但数据表明肺癌的死亡人数依然占据癌症死亡和发病人数排行榜的首位或次位。在肺癌的检查和诊断中,肺结节是肺癌的表现形式,当肺结节呈恶性时,就表明病人患上了肺癌。肺癌的形成是一个漫长的过程,是多种因素导致的过程,有早期、中期和晚期之分,通常认为肺癌早期的生存率更高,因此肺结节的“早发现,早治疗”就显得尤为重要。本文围绕肺结节的检测与分类展
步态是指人体行走时的姿态,也可以说是人体运动过程中的一种生物特征。其中包含了大量的运动信息,这些信息可以应用于生物认证、临床、人机交互等多个领域。在临床方面,步态分析主要用于辅助医生对正常步态和异常步态进行辨识以及帮助病人进行康复训练。髌骨疼痛综合症(PFPS)是一种临床上最为常见的膝关节疾病,患者会因疼痛而导致异常步态。我国髌骨疼痛患者数量庞大,早期并精确地检测出髌骨疼痛可以防止该疾病的进一步恶
为了实现便捷的充电,以无线能量传输技术为基础的无线充电方式引起人们的广泛关注,并成为当前研究的热点。由于电池的物理特性,负载参数如阻抗在充电过程不可避免会发生变化,为了实现负载恒流充电,需要设计补偿网络进行调整。为了解决多负载、多中继、中继混合负载传输环境下负载恒流的问题,本文基于T型补偿拓扑网络,搭建了无线充电中继传输的研究模型,并结合三种实际应用场景展开研究,主要的研究工作和贡献概述如下:(1
森林地表火蔓延是森林火灾的重要形式,风作为影响林火蔓延的重要因素备受研究者的关注。风是动态因子,主导林火的蔓延速度和方向,它与林火之间存在复杂的双向耦合作用。然而,传统的林火蔓延模拟系统并不考虑这一作用,导致模拟的准确性和真实性不足,而现有的林火-风双向耦合模拟方法又存在计算量大、耗时长等问题。为解决这些问题,本课题研究并提出一种全新的林火-风双向耦合模拟方法,同时搭建一套微尺度风数据采集平台,并
车辆再识别作为智慧城市的核心技术之一,目的是在多个不重叠的相机视图中检索出感兴趣的车辆。当前突出的算法通常先对数据集进行大量的人工标注,让模型在额外标注的辅助下,能够更精确的关注到局部细节信息,进而提升最终的测试性能。但是额外的人工标注不仅十分耗费资源,还会降低模型的泛化能力。针对以上问题,本文在福建省与福州市重点科技项目(2018H0018、2020-GX-17)的支持下,围绕基于深度学习的车辆
随着城市交通的迅猛发展,要实现对交通状况直观、高效的管理,交通视频监控已成为必不可少的技术手段。针对交通路口的视频监控,传统多路视频组成电视墙的监控方式,存在视频利用率低、单个摄像头视野局限性、信息缺失以及多视角显示凌乱等问题。全景视频是将多个视频流的重叠区域进行拼接,能在不降低分辨率的同时有效扩大监控人员的视野,已成为交通监控领域的研究热点。本文在分析交通视频监控需求的基础上,研究了视频拼接的相
多线圈磁谐振传输系统凭借着安全灵活、传输距离远的特点,引起了广大研究学者的关注。多线圈的结构非常适合采用波束赋形技术来提高传输距离和效率。如何在多个线圈中分配发射功率,是波束赋形设计中最重要的一个问题。因此,本文以多线圈磁耦合谐振传输系统的波束赋形策略为研究对象,针对物联网中的应用场景,设计了三种磁波束赋形优化方案。论文的研究内容和贡献如下:(1)针对单中继单接收机的无线能量传输应用场景,提出了一