【摘 要】
:
图像到图像的翻译是计算机视觉中图像处理的一个领域,目的是为了训练出一个模型,来进行图像和图像之间的转化。图像增强是图像到图像的翻译的一个方向,虽然基于深度学习的方法在图像增强和图像恢复上已经拥有了很多的成果,但是依然存在着不足之处。这篇文章提出了一个基于生成式对抗网络GAN的图像增强的神经网络,研究了在缺少正常/低光照图像对的情况下,仍然可以学习出低光照图像到正常光照图像的映射,因为在正常情况下获
论文部分内容阅读
图像到图像的翻译是计算机视觉中图像处理的一个领域,目的是为了训练出一个模型,来进行图像和图像之间的转化。图像增强是图像到图像的翻译的一个方向,虽然基于深度学习的方法在图像增强和图像恢复上已经拥有了很多的成果,但是依然存在着不足之处。这篇文章提出了一个基于生成式对抗网络GAN的图像增强的神经网络,研究了在缺少正常/低光照图像对的情况下,仍然可以学习出低光照图像到正常光照图像的映射,因为在正常情况下获得这样图像对是非常有挑战性的。本文在真实的图像数据集上进行研究,主要解决以下几个核心问题:使用GAN网络在非配对数据集上训练,来对低光照图像增强;目前低光照图像增强任务中,生成图片普遍存在着颜色失真,图像细节缺失的问题,这些问题需要解决;Retinex算法大都以反射图作为最终结果,这样生成的图像的自然度就会不够,因此需要在神经网络中引入更为合适的Retinex算法来对图像进行分解。针对这三个方向的问题,本文提出了以下创新点:(1)提出一种能够适用于非配对图像的低光照图像增强的GAN网络,让网络在生成图像的时候,生成方向是确定的,生成图像中的内容保持一致,并且图像的光照恢复。(2)对GAN网络的生成器进行改进,在生成器中加入注意力机制的跳跃连接来引导生成器的生成方向,同时提出新的损失函数来对整个网络进行训练。(3)提出一个更合适的Retinex图像分解算法,该算法能从图像中估计出光照分量,并且充分使用光照分量作为网络的输入,来学习映射。
其他文献
当下汽车工业正经历百年未有之大变局,电动化、智能化引领的汽车工业变革,正在催生不断变革的新一代电子电气架构,深刻影响全球汽车产业格局和汽车工业研发体系。不断突破的先进电化学技术提升了电池可靠性和续航能力,推动了整车动力系统从内燃机向电动化转型,同时也提高了对电池状态精准监控和电池管理系统功能安全的要求。本文针对实验室与某电池制造商合作的电池管理系统基础软件功能安全展开研究。本文依照ISO 2626
在过去数十年,全球范围内的皮肤病患者数量一直在急速增加,但相应的医疗设施和就诊意识却没有同步得到提高,患者普遍无法接受到足够的治疗。与此同时,使用人工智能算法进行辅助诊治的研究成果日益斐然,但普遍缺少直接提供辅助诊断服务的能力。因此本文研究旨在实现色素性皮肤病的自主辅助诊断系统,提供自主疾病监测服务,另一方面,医疗领域本身也存在着标注数据成本高、难度大的问题,这也使得研究解决少量数据集训练的问题成
图像语义分割旨在实现像素级的标签分类,是人工智能的热门研究方向之一。语义分割作为一项基础的视觉感知任务,其可以被广泛的应用于多种场景下,如无人驾驶、视频监控以及智能医疗等。由于卷积神经网络拥有较高的可迁移性和鲁棒性,基于卷积神经网络的语义分割方法被广泛使用。注意力机制通过模拟人类视觉机制的原理可以使模型有选择性地关注图像中的重要区域,以此提升分割效果。因此本文主要对基于注意力机制的图像语义分割方法
随着虚拟现实、物联网和智能制造等新技术的日趋成熟,广泛使用的云计算无法满足海量连接下的数据传输和处理。为了得到即时的反馈,边缘计算通过把计算节点迁移至移动接入网的边缘来降低传输时延。受硬件限制,边缘节点可能达到满载从而影响计算响应的时延,降低服务质量,策略路由可以实现边缘计算下的任务调度,为了减小任务调度带来的额外时延等影响,强化学习能够使策略路由具有资源感知和负载均衡的能力。本文对边缘计算下基于
随着软件产品变得越来越庞大,越来越复杂,第三方库已经成为大多数软件的必要组成部分。开发人员通常需要用另一个库替换一个库,同时维护库的相同功能。用不同的库替换一个库,这个变动的过程就称为库迁移。库迁移是一项非常乏味并且枯燥的任务,同时,迁移往往意味着非常大的工作量。迁移过程被广泛认为是一个困难的、容易出错的和耗时的过程。这种手工流程很复杂,而且对公司来说成本很高。为了解决上述库迁移过程中的问题,本文
互联网的快速发展,给人们提供了在线学习的条件和机会,很多希望提高自身知识水平和专业技能的人都选择参与在线教育来达到目的,而不论是线上还是线下教育,都产生了大量的学习互动数据,这些数据真实地反应了学习者的兴趣话题、情感态度、学习体验等特征,因此对于教育交互数据分析的成果,可以更好地帮助学习者定位学习资源,帮助教师组织教学内容,还能帮助课程平台加强基础建设。中国大学MOOC平台是国内提供众多开放式网络
随着互联网技术的蓬勃发展,越来越多基于移动设备开发的语言学习APP在此期间应运而生。目前,此类APP主要使用了间隔重复算法来计算再次记忆单词所需要的间隔时间,帮助用户更好地记忆单词,进而提高他们学习单词的能力。但是,传统的间隔重复学习算法仅仅通过固定的公式来计算再次记忆单词的间隔时间,忽略了个体用户记忆能力和学习能力的差异性,这会导致计算的间隔时间无法自适应用户的个体化差异。因此,如何更精确地计算
航电系统是一种可靠性要求度极高的安全关键系统,形式化验证将贯穿在航电系统中的每个生命周期阶段。在工业界,EA由于其具有普适性被广泛应用在各个领域的模型构建中。而在航电领域,AADL由于其出色的航空体系架构能力而被广泛应用。如何提高EA的形式化验证能力和航电系统的体系架构分析能力,是一个待以解决的问题。针对航电系统的特点和需求,本文提出的工具链是一类模型转化器,包含Safety_SysML和EA2A
由于移动通信网络实时性强、吞吐量大、场景复杂度高、故障有效数据易被覆盖以及通信信息数据呈现出非规则非线性等因素,目前的移动通信网络故障诊断方案往往面临资源开销大、响应慢、准确率低以及缺乏灵活性等问题。针对这些问题,本文从故障数据源获取以及诊断策略角度入手,运用限流算法、SOM算法、K-Means算法、TF-IDF算法以及3GPP相关知识等方法提供了一种低开销、快速、准确、轻量通用的智能化故障诊断方
指静脉识别作为一种生物特征识别技术。实现原理是依据特定波长的红外光线照射手指获得静脉影像,通过提取静脉影像特征来进行个体身份识别认证。由于其实现原理的特性,指静脉识别技术是一种非接触式的生物特征识别手段。在当前新冠疫情的背景下,该识别技术能够在有效的保证个体识别准确率的情况下,避免交叉感染。指静脉识别相较于其他识别技术,还有活体识别、精确度高、识别速度快等优点。本文从手指静脉图像的预处理,图像增强