基于深度神经网络的光学遥感图像飞机目标检测与细粒度识别

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:jeffzhangjf
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
飞机目标检测是遥感图像解译的一个重要分支,飞机在交通运输领域以及军事作战领域都有重要的应用,对其准确的位置与不同型号实现快速、高效的检测与识别具有重要的意义。本文针对高分辨光学遥感图像飞机检测任务中的复杂场景以及细粒度识别中的长尾问题和噪声标签问题,以自然图像经典单阶段目标检测算法做为基础,出了基于深度神经网络的光学遥感图像飞机目标检测与细粒度识别方法;并结合遥感图像解译的应用场景,针对性地升遥感图像解译的速度并节省计算开支。主要研究内容如下所述:(1)出了一种对噪声数据鲁棒的单阶段细粒度光学遥感图像飞机检测器。针对单阶段目标检测模型在细粒度识别任务上表现不佳的问题,基于经典单阶段目标检测模型Retina Net,引入细粒度分类模块将目标的特征细化后再进行分类。为了应对人工标注数据集中存在的类别噪声,将原始分类子网络的作用由类别区分转化为前背景区分,避免了错误的类别标签对模型学习是否存在目标的负面影响。出了一种噪声鲁棒的标签分配策略,在更好的对含有噪声的标签进行分配的同时使前背景分类器能够感知样本的质量。最后采集了数据集并进行细粒度标注,通过实验证明该方法比较于Retina Net方法以及其他一系列方法具有更高的检测和细粒度识别的精度。(2)出了一种基于难样例聚焦与梯度停止的遥感图像飞机目标检测与识别方法。针对部分目标检测和识别困难的问题,受经典分类器SVM的启发,基于SVM的理论基础出了一种基于支持样本的难样例聚焦方法,以动态的寻找困难样本,同时出了一种损失函数对其进行额外的聚焦监督。此外,细粒度识别任务中常伴随着类别不平衡问题,针对长尾问题出了类别感知损失和对不同类别的梯度停止方法。有效的升了对困难样本的区分能力,并一定程度上缓解了长尾问题带来的负面影响。(3)出了一种基于动态随机的8bit整型量化训练方法。针对8bit整型训练后量化方法误差较大的缺点,采用量化训练方法对模型进行8bit整型量化;采用逐通道非对称量化方法降低量化映射过程中的缩放误差;通过动态可学习的映射关系选取更合理的参数数值范围以最大化量化后权重的表达能力,并基于直通估计改进了梯度计算方法从而实现对映射关系的反向传播;最后,采用量化随机失活方法在训练过程中随机的选取参数进行量化,从而进一步降低量化误差,有效的使量化后的8bit整型模型保留了与全精度模型相近的精度表现。
其他文献
当前我们国家已经进入中国特色社会主义新时代,中国梦翻开了新的篇章,科学技术的发展交流,已经成为大国之间交流必不可少的话题。国家要强大,要发展,就离不开科学技术的支持。日本的科学技术能力历来领先于世界发展水平,笔者选择专利文献《固定ガスメータの判別システム》进行翻译实践,希望能够更好地促进中日两国之间的科技文化交流,提高我国科学技术水平。本报告共分为五部分。第一部分笔者对实践的具体情况和翻译文本的文
学位
随着国际化交流的日益发展,科学技术的飞速进步,和对外交流程度的日益加深,翻译已成为在社交,科技,知识全球化共享的必要推进方式之一。语言服务翻译领域也因而进一步扩大,所涉及的翻译内容也随之呈现多样化。随着翻译量的巨幅增长,翻译环境的改变,翻译人员的个人能力及综合素质也要与之全面提升,翻译质量的标准和规定也更加细化和严格。那么本次翻译由横河信息系统(大连)有限公司委托,由笔者参与的9人组成的小型翻译团
学位
随着遥感技术相关领域的飞速发展,遥感影像的应用需求也日益增加。遥感图像语义分割,作为一项理解遥感影像的关键视觉任务,已广泛应用于城市规划、智能农业、环境保护等领域。近年来,深度学习的快速发展促进了遥感图像语义分割性能的不断提升,但由于遥感图像数据本身具有图像尺度大、成像范围广、背景信息复杂多变的特点,现有方法仍然在分割多尺度物体时面临分割精度低的挑战。本文针对这些挑战,对遥感图像语义分割展开了研究
学位
无人机可以为深入理解和分析行人行为供独特视角,基于无人机影像的行人定位与识别已经成为无人机图像处理的热门研究领域。而人作为社会活动和军事活动的主体,对其在无人机视角下进行准确且快速的检测与识别具有重要的实用价值。针对无人机场景下的行人目标具有密集、遮挡严重、特征模糊、尺度变化大、中小目标多等特点,并考虑到实际应用的高效性,本文对现有的通用目标检测方法进行了深入探索,并出了一系列高效的基于深度卷积神
学位
中国作为发展中国家的代表性国家,致力于从“高速”经济到“质量”经济的转型,从而慢慢浮现出“一味地模仿只能跟在其他发达国家的后面,无法将其超越”的客观问题。这一转型,引起了许多公司与个人对“知识产权”也就是“专利”的重视。作为经济高度发达的日本,也作为专利大国,不少中国企业在借鉴日本专利,或在日本注册专利时必须借助“翻译”手段,将两国语言互相转换,以便达到更好的借鉴或发生不必要的产权纠纷,促使专利工
学位
随着日本国内人工成本的不断上涨,大部分日本IT企业都开始了信息系统开发业务的海外外包,其中,因人工成本相对偏低且同样是汉字文化圈的中国逐渐成为了主要海外外包对象国。在强烈的外包业务需求下,作为委托方和承包方进行沟通交流的主要媒介的信息系统开发相关文档的翻译需求也不断扩大。本翻译实践报告是根据笔者进行日本信息技术企业的信息系统开发相关文档的日译汉翻译的基础之上撰写而成的。翻译内容是从信息系统开发到正
学位
近年来,由于对自动驾驶和视觉监控的需求,多传感器融合使用受到了很大关注。除了传统的RGB之外,红外传感器以及一些激光雷达等深度传感器也被广泛使用,准确的深度图的采集对于自动驾驶至关重要。目前的深度获取方法多种多样,其中一种方法是使用双目立体匹配预测视差,视差可以通过焦距转换为深度,这样的深度图可以大致得到场景的三维信息,但其精度存在误差。另一种方法是直接使用Li DAR相机捕获精度高但由于扫描通道
学位
随着科学技术和电器产业的迅猛发展,新的科技发明层出不穷,各国之间的相互交流也日益频繁。因此,科技专利的翻译是引进和借鉴国外先进技术的主要内容和重要手段。本稿是一篇关于《流量测量装置》电器专利发明的日汉翻译报告,主要包括翻译项目的介绍,翻译过程,实例分析,总结四个部分。第一部分对该翻译项目的简单介绍,第二部分为翻译过程中所进行的工作,包括专利翻译时的注意事项和背景知识、理论框架、翻译过程、翻译后的工
学位
稀疏问题是在现实生活应用十分广泛的一类问题,已经有很多解决各种实际应用问题中稀疏问题的传统优化算法以及深度网络的方法,例如,图像去噪、图像修复、图像超分辨等等。传统优化算法具有高度可解释性但低性能的特点,而一般的深度网络方法具有高性能但其可解释性却较为缺乏。近年来,深度展开网络由于能够有效结合传统优化以及深度网络的优点,逐渐成为关注度高的一类方法。在传统优化启发下,本文主要从以下三个方面对求解稀疏
学位
为适应伴随科技进步而日趋复杂的电磁环境,无线通信系统在朝着多频段、多功能的方向发展。人工电磁材料通常被应用在无线通信系统中,为了满足无线通信系统的需求,其正朝着在一种单元结构中集成多种功能的方向发展,其中最受关注的两个方向是可重构和多频人工电磁材料的研究。可重构人工电磁材料可以将多种功能集成在一种单元中,在不同的状态实现不同的功能,但目前仍存在偏置电路设计复杂、工作带宽窄和调谐带宽窄等问题。频率选
学位