【摘 要】
:
合成孔径雷达(Synthetic Aperture Radar,SAR)作为一种全天时、全天候的主动传感器,在军事和民用领域都有着重要作用。由于通过SAR获取的图像中包含着丰富的信息,使得对SAR图像解译变得至关重要,其中,SAR图像目标识别是一个重要的研究方向,近年来得到越来越多研究者的关注。但目前依然面临着诸多挑战,如样本数据少、训练容易过拟合、相干斑噪声对识别结果的影响、如何提取SAR图像特
论文部分内容阅读
合成孔径雷达(Synthetic Aperture Radar,SAR)作为一种全天时、全天候的主动传感器,在军事和民用领域都有着重要作用。由于通过SAR获取的图像中包含着丰富的信息,使得对SAR图像解译变得至关重要,其中,SAR图像目标识别是一个重要的研究方向,近年来得到越来越多研究者的关注。但目前依然面临着诸多挑战,如样本数据少、训练容易过拟合、相干斑噪声对识别结果的影响、如何提取SAR图像特征等。围绕这些问题,本文以稀疏字典学习模型为基础,从五个角度出发开展研究,即多尺度字典学习、对噪声鲁棒的字典学习、核字典学习、分类器融合技术以及结合卷积神经网络(Convolutional Neural Network,CNN)的字典学习等。具体研究内容如下:第一,针对SAR图像训练数据少、斑点噪声影响识别率的问题,提出了一种多尺度增量字典学习(Multiscale Incremental Dictionary Learning,MSI-DL)算法。首先通过不同参数下的高斯函数提取SAR图像样本的多尺度特征,图像的模糊程度越大,斑点噪声抑制越明显,但是同时图像中的有用信息丢失得也越严重。与单字典学习不同的是,现将不同尺度特征的重构误差项放在同一个目标函数中用来训练多字典,不同重构误差项之间的相互制约可以避免小样本时训练的过拟合。为了实现分类任务,在目标函数中引入线性分类误差项,实现字典与分类器的联合训练,避免了分开训练导致的次优问题。针对多尺度带来的内存开销问题,通过增量的方式每次读取部分样本进行字典和分类器的更新优化。实验验证了该算法在小样本和抗噪声方面的有效性。除此之外,在MSI-DL基础上进一步提出使用l1范数取代Frobenius范数计算重构误差项以增强SAR目标识别对噪声的鲁棒性。第二,由于SAR图像数据存在非线性,使用传统线性字典学习给分类任务带来了困难。针对这一问题,提出了多尺度核字典学习(Multiscale Supervised Kernel Dictionary Learning,MSK-DL)算法。与MSI-DL不同的是,这里采用对抑制乘性噪声更有效的Frost滤波函数提取图像的多尺度特征,并通过隐式定义的非线性映射函数将多尺度特征映射到更高维的线性空间进行字典学习。对于这类非线性函数所导致的优化问题,提出了两种基于核方法的优化算法进行求解。实验表明,非线性的引入可以显著提升SAR目标识别率。与此同时,针对稀疏表示线性不可分问题,提出了一种联合线性和非线性分类器的核字典学习算法。非线性分类器采用的是多层感知器。因此,模型的目标函数包括一个非线性重构误差项和两个分类误差项,通过求解损失函数对各个变量的梯度并用梯度下降法进行更新,实验结果验证了联合线性和非线性分类器可以提升SAR目标识别率。第三,大部分传统的字典学习采用的是原始图像或者手动提取的特征,对图像的刻画具有局限性。而CNN具有自动提取图像特征的优势,因此提出了将CNN作为特征提取器自动提取SAR图像特征并用于字典学习的方法。CNN的输出看作是原始图像的多特征,用于训练多个字典,采用均方误差作为最终的损失函数从而完成分类任务。整个模型是一个端到端的结构,包含三个部分,即CNN特征提取、字典学习和分类,三部分联合优化,通过反向传播算法更新参数。实验结果表明,与手动提取特征相比,结合CNN的字典学习方法识别率得到了提升。与深度学习模型相比,在识别率接近的情况下运算速度更快。为了充分利用CNN不同层代表的不同深度信息,提出了基于CNN的分层核字典学习。将CNN不同层的输出作为核字典学习的输入。相比于MSK-DL算法,CNN多层结构的利用实现了对图像深度特征的自动提取,在一定条件下提升了识别率。CNN结构对图像的降维也降低了接下来字典学习的计算量。
其他文献
光学频率梳(简称“光梳”)提供大范围等间隔的相干频率梳齿,且每个梳齿对应绝对光学频率,已成为光学计量和测量技术中重要的光源。相干双光梳干涉仪可以充分利用光梳在频率准确度、频率分辨率、光谱范围和脉冲宽度等方面的卓越特性,在诸多基于光梳的测量技术中脱颖而出。双光梳干涉仪在频域上表现为两个有微小梳齿间隔差异光梳的多外差探测;在时域上表现为两个有微小重复周期差异脉冲序列的等效时间采样。在光谱测量领域,双光
伴随着互联网、移动通信等领域的技术革命,智能家居、无人驾驶和工业自动化等新兴跨学科领域蓬勃发展,现代社会开启了万物互联的物联网时代。传感技术作为物联网的“眼睛”,承担着从物质世界感知与获取信息的任务,是构成物联网的重要基础技术。光学传感器具有抗电磁干扰能力、高速传输、非接触、非破坏性、可遥测等特性,相比传统电子传感技术具有无可替代的技术优势,因此,光传感技术在消费电子、能源勘探和生物医学等应用领域
计算电磁学为电磁散射特性的研究提供了有力的理论支撑。计算电磁学涵盖了对多种数值算法的研究,例如时域有限差分法、矩量法和有限元法等。根据求解域的不同,各方法又可以分为时域方法和频域方法。该论文主要研究时域积分方程方法,开发出了一些混合方法来分析理想电导体结构和均匀介质目标的瞬态散射响应问题,使得时域积分方程方法更加稳定,更加高效,且适用性更广。本文的主要贡献可以概括如下:(1)从时变麦克斯韦方程组出
随着终端设备算力的不断提升,自动指纹识别系统越来越广泛地应用于身份验证,以保护个人隐私和生命财产安全。广大研究人员投身于指纹识别算法的研究中,指纹识别技术得到了长足的发展。但在以下三种应用场景中,指纹系统的准确率、效率和鲁棒性还有待进一步提高。第一,在匹配识别含有裂纹或噪声的低质量指纹图像时,系统准确率会出现明显的下降,需要设计有效的裂纹修复算法来提升识别准确率。第二,在处理1比n的指纹识别场景中
5G时代,网络呈现万物互联、以信息为中心化、虚拟化的趋势,其低时延、广连接、强鲁棒等特点可以满足各种垂直行业(如能源、工业控制、交通等)的差异化服务需求。智能电网被认为是5G非常有代表性的一个应用场景,5G技术的引入为智能电网中信息的高效传输、能量的可靠分发及资源的灵活调度提供了有效支撑。作为国家的关键基础设施,能源网络是现代工业和经济活动的支柱,5G技术的引入不断驱动着新型智能电网的革新和发展。
在传输和接收过程中,语音信号不可避免地会混入噪声信号,语音增强技术的目的是从被噪声污染的信号中恢复理想语音信号,在通信系统接收端、远程会议、智能家居、驾驶舱等不同场景中都有重要的应用价值。过去的几十年间,语音增强技术得到了广泛研究,代表性的的语音增强技术有谱减法、维纳滤波、统计模型法、子空间法等。噪声场根据空间相干性可以分为:扩散噪声场、非相干噪声场、相干噪声场,其中相干噪声场由远场点源噪声产生。
行人重识别技术是安防监控领域的关键性任务之一,是计算机视觉领域近年来深受关注的研究热点。在无重叠的视频监控网络中,对于摄像头中给定的某个行人,行人重识别的目标是检索到该行人在其他摄像头下出现的所有图片。作为自动识别目标行人的技术,行人重识别能够在安防监控系统中对感兴趣的个人进行快速定位,可以广泛应用于行为监控、分析和预警等实际问题中。随着大规模计算资源的提出,利用深度学习的方法自动学习特征用于分类
现代电力器件与电子设备对于系统稳定运行的要求日益增高,所以设备附近的电磁干扰越来越引起人们的重视。电磁敏感场合对于环境中的电磁发射有明确的条例规范,例如汽车电子的CISPR25以及航空无线电的GB6364。对于通过电磁进行能量传输的无线电能传输技术(WPT)而言,其工作时会产生谐波干扰从而对附近电磁敏感设备造成影响。中国工信部最新发布的《无线充电(电力传输)设备无线电管理暂行规定(征求意见稿)》中
智慧出行依赖于对实时路况等城市交通环境信息的准确及时获取与利用。随着通信技术的日趋成熟以及智能移动终端的爆炸式普及,车辆群智感知作为新兴的感知模式,利用车载智能终端从城市环境中感知获取信息,可以完成传统无线传感网络难以处理的复杂任务。车辆群智感知具备感知节点数量多、移动速度快、感知数据规模大和部署成本低等特点,被广泛应用于智慧出行系统的诸多应用之中。然而,当前车辆群智感知覆盖在时空上仍存在盖不全和
脉宽更窄、峰值功率更高的光脉冲一直是高精度测量、材料加工、信号处理等诸多应用的追求。锁模技术作为飞秒脉冲的主要产生手段,在过去几十年发展迅猛。依靠偏振控制和Kerr非线性的非线性偏振演化(Nonlinear polarization evolution,NPE)锁模因其结构简单、性能优越而成为实现锁模激光器的重要选择。通过精细的偏振调节,NPE锁模激光器可以产生各种脉冲状态。然而,NPE锁模激光器