【摘 要】
:
水下目标检测旨在定位和识别水下场景中的目标,在海洋探测和监测、自主水下航行器等水下应用中具有重要意义。然而在复杂的水下环境中获取的图像通常存在严重的退化,影响水下目标检测等高层次视觉任务的执行。水下图像增强算法可以改善图像退化,提高水下图像质量,但是水下缺少真值图像,基于学习的方法在合成数据上训练的模型泛化性能有限,并且图像增强与目标检测任务的优化目标不同,仅考虑算法的增强效果时,增强后的图像不一
论文部分内容阅读
水下目标检测旨在定位和识别水下场景中的目标,在海洋探测和监测、自主水下航行器等水下应用中具有重要意义。然而在复杂的水下环境中获取的图像通常存在严重的退化,影响水下目标检测等高层次视觉任务的执行。水下图像增强算法可以改善图像退化,提高水下图像质量,但是水下缺少真值图像,基于学习的方法在合成数据上训练的模型泛化性能有限,并且图像增强与目标检测任务的优化目标不同,仅考虑算法的增强效果时,增强后的图像不一定能真正帮助目标检测任务的执行。如何有效增强水下图像,提高水下目标检测算法的性能,成为水下计算视觉的热点和难点问题。本文针对真实场景下水下图像退化,影响水下目标检测等高层次任务的执行这一问题,首先提出了两步域适应水下图像增强方法,提供了利用迁移学习解决水下图像增强问题的新思路。进一步,为了使增强后的图像更好地应用于实际,在第一个工作的基础上提出了基于深度迁移学习和颜色恢复模型的水下图像增强算法。最后,提出了真实场景下联合水下图像增强与目标检测算法,同时优化水下图像增强和目标检测,使水下图像增强算法能够真正提高目标检测任务的性能。本文的主要创新如下:第一,由于水下缺少成对的训练图像,许多方法在合成的水下图像上训练的模型,导致这类方法在增强真实场景的水下图像时泛化性能有限。针对这一问题,受迁移学习启发,提出了一种新的两步域适应水下图像增强方法,将图像去雾迁移到水下图像增强。通过风格迁移域适应模块和图像增强域适应模块,实现了水下域到空气域的跨域迁移。该方法不需要使用合成的水下图像训练,不依赖于水下真值图像。第二,针对水下航行器探测海洋时视觉系统获取的图像能见度低、细节模糊、颜色失真的问题,在第一个工作的基础上,提出了基于深度迁移学习和颜色恢复模型的水下图像增强方法,在域变换模块中嵌入颜色恢复模型,恢复出满足物理模型且更自然的水下图像。并且在域变换之前增加粗粒度的图像相似度计算,提高算法的性能,有效去除图像中的色差,提高了水下图像的质量,帮助水下探测任务的执行。第三,水下图像的退化影响水下目标检测任务的检测精度,许多水下图像增强算法单纯追求图像增强的效果,没有考虑增强后的图像对后续的水下目标检测任务的影响,导致了图像增强与目标检测不同的优化方案。针对上述问题,提出了一种真实场景下联合水下图像增强与目标检测方法,同时优化图像增强与目标检测,在改善水下图像退化的同时生成有利于水下目标检测的水下图像,提高水下目标检测的精度。
其他文献
随着普通高校大学生舞龙课程的不断开设,舞龙课程部分评价体系的内容与社会舞龙专项人才需求和教育教学改革实践不相符。为了促进普通高校大学生舞龙课程教学质量评价体系改革的完善与发展,解决现行普通高校大学生舞龙课程教学质量评价体系中某些指标与学校培养目标之间的现实矛盾,提出了普通高校大学生舞龙课程教学评价体系优化的思路。本篇文章运用文献资料、问卷调查、德尔菲法、层次分析和数理统计等方法,选取指标,确定权重
在外语教学与测试领域,语用得体性备受关注。有研究认为双语域建构型任务能有效地诱发考生语用得体性的表达。所谓双语域任务即要求考生向关系亲疏远近不同的沟通对象就同一主题表达意义。本研究旨在论证双语域邮件写作任务(正式和非正式)是否比单语域邮件写作任务能更好地测量语用得体性。基于解释/使用论证框架(IUA),本研究对该任务的分数解读进行效度论证构建与检验。研究采用混合设计,招募了 48名高水平语言学习者
由于经济社会的快速发展,决策环境变得日益复杂,多种模糊信息表征形式被提出以表达对客观事物的评价。其中,犹豫模糊对偶语言术语集是一种新提出的定性信息表达形式,它由两层独立的语言术语集组成,第一层语言为专家对客观事物的基本评价,第二层语言为第一层语言术语的可靠性和概率描述。相比于概率语言、语言分布等信息形式,犹豫模糊对偶语言允许专家使用语言表达概率描述,这更加符合人类的表达习惯,且能够为专家在评价过程
阅读理解是一种认知需求活动,涉及理解监控和推理。在预期推理修正过程中,人们通过监控来修正初始推理,产生与上下文一致的刚刚修正的推理。由于工作记忆容量和抑制控制能力会影响老年人在推理加工水平的表现,而在汉语叙事语篇阅读领域,对老年人的推理修正能力知之甚少,因此本研究的主要目的是:(1)探究青年人和老年人在预期推理修正上的年龄相关差异;(2)研究工作记忆容量和抑制控制能力对青年人和老年人预期推理修正加
当前,我国资本市场逐渐向多层次发展,各行各业之间的合作业务逐渐增多,整个市场的自由化程度越来越高,混合型业务层出不穷,在这样的趋势下,如果市场体系中有某个机构或行业出现危机将迅速波及合作机构,危及到股票市场,更严重的情况下实体经济也会受到拖累,最终对中国经济造成破坏。面对复杂的经济结构和股票市场,研究如何运用科学手段有效防控系统性金融风险具有重要意义。本文以我国28个申万一级行业指数2006年1月
非流利指的是导致语流中断却并未增加命题内容的言语现象。在日常生活中,非流利现象非常常见。非流利与流利事实上是概念相似的两个术语,中国的学者在研究口译流利现象时倾向于使用“流利”,而外国学者则多用“非流利”。作为口译研究中的一个热门话题,国外的非流利研究体系和架构都比较健全,在认知、语言、文化等各种角度下都对非流利现象展开了研究。相较之下,国内学者在这方面的研究并不深入,尤其是在不同语言方向的对比研
在翻译不对等情况下,创新性是译者提出解决方案的关键。在词汇层面,译者通过创造新词或新用法,从而有机会丰富目标语言的词汇和表达方式。已有研究基于语料库语言学方法,观察了翻译语言中的词汇创造性特征(Kenny 2014;Vintar 2016),发现了一些创新词汇,并辅以验证翻译共性或译者创新性。本文进一步将新词的时间因素考虑在内,探讨创新词汇及其历时变化。研究主要讨论了两类创新词汇:新词和旧词新用词
在多属性决策问题中,传统的二支决策方法不仅对信息的完整性要求较高,而且只能给出接受或者拒绝两个决策结果。在二支决策的基础上,三支决策允许决策者做出第三种决策,即不承诺决策,在信息不完备的情境下可以有效降低决策损失。随着决策环境的日益复杂,精确属性评价值愈加难以获取,模糊性成为多属性决策问题中的常见现象。Q阶序对模糊语言集结合语言术语集和Q阶序对模糊集在描述模糊信息方面的优势,能够给决策者更加自由的
由于现实决策环境日益复杂,同时人类的思维认知存在模糊性与不确定性,许多决策者更倾向于使用模糊数或语言词表达决策信息。广义序对模糊数由直觉模糊数发展而来,允许决策者赋予隶属度和非隶属度0到1之间的任意实数值,具有更广阔的模糊信息表达范围;二元语义模型由一个语言词和一个实数组成,可以表示语言术语在信息集成过程中的任意结果,从而能够有效避免决策过程中的信息损失。广义序对二元语义综合了二元语义与广义序对模
山东省经济处于由高速增长转向高质量发展的阶段,各市经济发展差异明显。全要素生产率是评判一个地区或国家经济增长的重要指标,其测算结果能够帮助我们认清山东省17市的经济发展现状,指明未来发展方向。如何去测算全要素生产率?不同测算方法得到的结果又有怎样的差别?全要素生产率又受到哪些影响因素的影响?围绕上述问题,本文采用多种测算方法对山东省17市的全要素生产率进行详细测算,并对测算结果进行对比分析,采用动