【摘 要】
:
图像去模糊处理是图像复原中重要的研究任务,然而目前图像去模糊研究大部分是针对整张图像,但在实际生活中,人们往往希望对图像中的特定目标进行去模糊,如人脸、行人、指示牌、车牌等,而对图像的背景则没有去模糊的需求。本文研究了主要针对行人的特定目标去模糊算法,工作内容和创新性如下:提出一种针对行人去模糊的生成对抗网络(Pedestrain Deblurring Network,PDNet),能够针对图像中
论文部分内容阅读
图像去模糊处理是图像复原中重要的研究任务,然而目前图像去模糊研究大部分是针对整张图像,但在实际生活中,人们往往希望对图像中的特定目标进行去模糊,如人脸、行人、指示牌、车牌等,而对图像的背景则没有去模糊的需求。本文研究了主要针对行人的特定目标去模糊算法,工作内容和创新性如下:提出一种针对行人去模糊的生成对抗网络(Pedestrain Deblurring Network,PDNet),能够针对图像中的行人更好地去模糊,该网络由生成器和鉴别器构成。其中,生成器采用特征金字塔骨干结构,该结构采用Inception-Res Net网络框架,该框架在性能上优于Moblile Net等其他轻量化框架;鉴别器采用双尺度结构,全局鉴别器针对图像中的总体轮廓信息,局部鉴别器针对不同的细节信息。本网络在更少的参数量的同时,在运算速率上也比其它网络快将近1倍。基于上述网络结构,本文提出以下两种算法实现对图像中的行人进行重点去模糊。(1)设计并实现了基于目标检测的行人去模糊算法(Target Detection Pedestrain Deblurring Network,TD-PDNet):对图像中的行人进行检测,随后将检测框坐标和模糊图像相加一起放入去模糊网络中,随后对行人部分增加权重,类似于注意力机制,将网络的注意力集中在框内行人部分,由此通过网络训练实现对图像中行人的重点去模糊任务。该算法在Go Pro数据集下的PSNR指标达到29.63,SSIM指标达到0.942,并获得较好的视觉去模糊效果图。(2)提出一种基于多尺度卷积的行人去模糊端到端网络算法(Multi-Scale Convolution Pedestrain Deblurring Network,MSConv-PDNet):在生成器中加入多尺度卷积的特征融合算法,该模块包括空洞卷积、丢弃卷积和通道转换卷积。其中,空洞卷积用来扩大局部感受野;丢弃卷积用来有规律性地丢弃一些数据;通道顺序转换卷积用来有规律性地打乱通道。并在误差反向传播中对行人进行加权处理,促使网络着重提取行人特征,从而实现对行人的重点去模糊任务。并选取Go Pro测试集全部图像,将其中的行人进行标注用来测试该部分的去模糊效果,行人部分的PSNR指标达到40.45,SSIM指标达到0.992,同时也获得了较好的视觉去模糊效果图。在HIDE数据集上的PSNR指标为29.3,SSIM为0.924,并获得较好的去模糊视觉效果图。综上所述,本文所提出的两种PDNet在客观和主观指标下均取得了较好的效果,以此验证该算法性能的优势,并提出了一种计算局部图像信息的客观指标的方法。
其他文献
目前,管道安全预警领域中应用较广的光纤预警系统具有抗干扰能力强、敏感度高等优点,且能够实现对长距离管道运输过程中的外界入侵事件监测识别和定位。该系统利用光纤传感技术采集入侵事件产生的振动信号,然后结合信号处理技术和模式识别技术实现对入侵信号的识别,从而预防入侵事件引发油气管道事故。本文基于相位敏感光时域反射技术的光纤预警系统,开展该系统中对光纤入侵信号的特征提取与识别算法研究。本文首先分析了光纤入
圆周扫描地基SAR(Circular scanning ground-based SAR,GBCSAR)是一种具备三维成像能力的新体制地基SAR系统,它将圆迹SAR模式引入地基平台。区别于传统的直线轨道地基SAR,它通过圆周运动采集数据,从而形成二维合成孔径,掌握场景的三维信息,具备三维成像、数据采集便捷的优势,但其特殊的圆周运动轨迹给三维成像增加了难度。尽管国际上已经理论论证了其三维分辨能力,但
近年来随着航空科技的不断发展,无线遥测遥控领域用户终端以及数据吞吐量在不断的增大,如何高效利用频谱资源已经成为人们研究的热点。为了提高频谱利用率一般可采用扩频技术或者高效的调制方式来实现。成型偏移正交相移键控(SOQPSK)信号属于一类连续相位调制信号,其包络恒定并且具有频谱利用率高和功率利用率高的优点,现已经被列入IRIG106航空遥测标准。美国军方也采用了此标准,用于卫星通信和宇航中。SOQP
近年来航天发射任务日益增多,对遥测系统可靠性要求日益提高。遥测发射机是遥测系统最为核心的工作设备,直接影响着遥测数据获取的质量与效果,决定了遥测任务的成败。传统箭载遥测发射机主要采用超外差结构实现发射通道,该结构采用多级串联变频,结构冗长、使用分立器件多,系统故障率相对较高。本课题结合航天发射任务要求,采用结构简单的零中频结构和冗余备份设计对传统超外差式箭载遥测发射机提出高可靠化改进。设计并实现了
面向视频数据的行为智能分类研究因其具有重要意义和应用价值,目前已经逐渐成为学术界与产业界的研究重点。该研究不仅苛求于算法模型能够挖掘视频中完备的空间特征,亦需对时间信息进行有效表达。尤其是在时间建模方面,近年来的算法研究多数通过引入时间差分操作来提取相邻帧之间的运动信息,并使用相加融合或注意力融合的方式将其融入到原始特征当中,取得了一定效果。然而,通过分析,时间差分操作以及对运动信息无差别对待的方
随着智能化时代的到来,目标识别技术已在诸多领域得以实现。针对不同的识别任务人们常依赖于专家经验所设计的网络,这就需要专家具备较高的设计水平和实践能力,无形中拉高了网络框架设计的门槛。因此借助神经网络架构搜索算法实现网络的自动搜索成为了当今研究的热点,通过神经网络搜索出的网络具有参数量小、模型复杂度低、检测速度快等优点。本文的第一个研究内容是选择一个最适合与MobileNet轻量化网络结合的目标识别
铁路环线信号已被应用于轨旁电子设备(Line Side Electronic Unit,LEU)向高铁车载设备的半连续通信,其特点是采用了直接序列扩频调制方式。该信号可以传递行车速度、坡度和列车定位信息。目前,铁路环线通信技术主要应用在欧洲列车控制系统(European Train Control System,ETCS)中。在我国,随着国家关于中欧铁路环线通信合作项目的推进,同样需要开展铁路环线
人体动作识别是计算机视觉领域的一个重要的研究方向,旨在使计算机能够自动识别人体动作。人体动作识别技术在智能监控、无人驾驶、人机交互等方面都有广泛的应用。随着深度学习被应用于人体动作识别领域,人体动作识别准确率有了显著提升。这其中空域特征与时域特征最为常用,然而时空特征存在复杂多样性和时空对应关系利用不足的问题。针对人体动作时空特征复杂多样性以及时空特征之间对应关系利用不足问题,本文对基于多特征学习
人体的细胞液由细胞内液和细胞外液组成,在健康状态下,细胞内外液维持着动态上的平衡。当人体患有某种疾病时,如肾病,细胞内外液水含量将会失衡,从而导致人体出现脱水或者水肿的症状。生物电阻抗技术是利用电学的方法测量人体水分,以此来提取人体的生物电阻抗信息,并根据这些信息来反映人体的生理或病理信息的技术。人体阻抗的测量方式是通过恒流源向人体施加安全激励电流,并采集人体反射回来的电压与电流信号来计算人体的阻
伽玛射线暴是宇宙学尺度上,恒星级天体爆发过程中产生的某一方向伽玛射线强度瞬时增强又迅速减弱的现象,揭示着宇宙学距离起源,伽马射线暴探测是当前天文学研究最活跃的方向之一。伽马射线探测的核心需求有两个,一个是在保证较大视场的前提下,提高位置分辨能力,另一个是提升能量分辨能力。这些探测需求的提升都使得伽马射线探测技术逐渐向着大规模,高集成度的方向演化,这对与之匹配的读出电子学技术也提出了新的需求。本文设