基于YOLOv3的低照度目标检测算法研究

来源 :东北师范大学 | 被引量 : 0次 | 上传用户:hhf1985
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着科技的发展,智能化的摄像头已经普及,目标检测也因此得到了广泛应用。例如,在无人驾驶、视频监控和智慧城市等领域都可以看到它的身影。尽管目标检测算法在正常光照的数据集上取得了良好的效果,但是在低照度情况下进行目标检测仍然是一个难题。最主要原因是:目标检测算法的训练集往往是正常光照的图像,而在低照度情况下获得的大多是亮度偏低的图像,因此训练集和测试集之间就存在了巨大且复杂的数据偏差,不仅体现在像素级偏差(如明暗不同,噪音不同)还体现在特征级偏差(如目标不同,场景不同)。所以,为了提高低照度情况下目标检测的准确率,尽量减小训练集和测试集之间的偏差就显得非常重要。针对数据偏差的问题,本文围绕低照度目标检测算法展开了研究,提出了基于YOLOv3的低照度目标检测算法。本文主要工作内容和创新点是:第一,为了减小像素级偏差,本文采用双向拉近的方法对图像进行预处理。因为低照度图像和正常照度图像之间存在着巨大的偏差,所以只对低照度图像增强或只对正常光照图像暗化无法有效地减小两者的距离。因此,本文同时采用了低照度图像增强算法和正常照度图像暗化算法将两个数据集向彼此拉近。具体步骤是:首先,利用图像信号处理过程将正常照度图像暗化为低照度图像;然后,使用Dce Net将低照度图像进行增强。第二,为了减小特征级偏差,本文提出了Y3JNet(YOLOv3 Jigsaw Network),该网络将特征适应算法与YOLOv3目标检测算法融合,共享主干特征提取网络,将低照度增强图像和暗化图像映射到同一空间,减小特征之间的偏差。第三,针对特征适应任务和目标检测任务,本文使用多任务学习的方法,平衡多个损失函数,提升训练效果。本文使用提出的基于YOLOv3的低照度图像目标检测算法在Exdark数据集上对11个分类进行了测试,利用双向拉近的方法将m AP从37.74提高到39.29,添加特征适应算法后m AP提高到39.70,加入多任务学习后m AP提高到40.19。本文不仅进行了消融实验,并且与近期的算法进行了对比实验。实验结果表明,本文提出的算法能够有效提高在低照度情况下的目标检测效果。
其他文献
问答(Question Answering,QA)是自然语言理解中具有挑战性的任务,近年来备受研究人员关注。目前大多数关于问答的研究都是根据单个文档甚至单个段落来回答问题,即问题的答案往往来源于单个文档或者单个句子,也称之为单跳推理问答。多跳推理问答相对单跳推理问答来说是一个更具有挑战性的任务,它要求模型能够对多个文档和问题之间的关系有深入的理解,即需要模型从文本的不同部分收集信息来回答问题。这就
学位
人脸表情可以有效地表达人的情感,是一种可以最直观传递人情感状态的非语言信号。在计算机与人工智能快速发展的背景下,基于深度学习的人脸表情识别技术在计算机视觉领域中发展迅速,并在智慧康养、人机交互等领域取得了众多应用成果,逐渐成为学术界和工业界研究的热点。然而,以往基于传统深层网络的表情识别研究主要利用单一面部表情线索信息,当面部表情被遮挡、图像质量不高时,传统方法的性能往往较差。考虑在真实场景中,人
学位
人脸检测是计算机视觉领域中的一个重要研究方向,也是人脸识别、人脸跟踪和面部表情识别等视觉任务的基础。人脸检测在生活中的应用场景也随处可见,如公司考勤、车站安检和“刷脸”支付等。随着网络性能的提升,人脸检测方法的网络模型越来越复杂,检测精度不断提高,检测速度却逐渐降低。由于人脸检测的实际应用场景对检测精度和速度要求很高,而且应用设备的内存和计算能力都非常有限,所以目前大多数的人脸检测方法不能很好地满
学位
大规模在线公开课程(Massive Open Online Courses,MOOC)又译为“慕课”,是随着科技发展流行起来的新兴课堂形式。慕课不拘泥于时间、地点,又内容多样、资源丰富,自出现起就备受全世界学习者的喜爱和关注。然而慕课数量巨大,质量良莠不齐,如果不对慕课进行质量评估,不仅会浪费学习者的时间筛选慕课,同时也会对慕课平台的留存率产生负面影响。怎样充分地利用慕课属性及学习者的学习行为,合
学位
近年来,个性化的习题推荐一直是教育领域的重要研究课题,习题推荐通常分为两个过程,一是根据学生的做题记录来了解学生的知识点掌握情况,二是根据学生的知识点掌握情况结合相关学习策略为学生推荐合适的习题,以达到帮助学生学习的目的。根据学生的特点为学生个性化地推荐习题,可以提高学生学习效率,提升学生的知识水平,也可以帮助学生探索新的知识,复习遗忘的知识点。这对帮助学生更好地掌握、探索、学习与巩固知识点都有着
学位
采用料浆渗铝法在T92钢上开展了渗铝工艺研究,测试了700℃料浆层厚度约80μm渗铝层生长动力学,采用XRD、SEM及EDS对渗铝层表面物相结构和渗铝层截面形貌、厚度和成分进行研究。结果表明:渗铝的前3 h活性Al原子([Al])向内扩散形成Fe2Al5 (η)相;随后[Al]开始在料浆层与渗铝层界面堆积,此时,Fe以较快的速度向外扩散并形成Fe2Al5 (η)和FeAl3 (θ)混合相外层;10
期刊
目前,自然语言处理是人工智能的热门研究领域之一,它涉及的研究方向很广泛,如文本分类、机器翻译、信息抽取等。其中,信息抽取旨在通过算法实现自动从文本中获取各种各样的信息。文本的形式各种各样,一般可分为结构化文本,半结构化文本和非结构化文本。本文研究的信息抽取任务主要是从非结构化的文本中抽取相关信息构建结构化的数据。文档是保存信息的一种主要方式,并且文档中的绝大多数信息是以无结构的纯文本形式存在,它们
学位
在科学研究中,同时具有数值属性和分类属性的混合数据是有着重大意义的。经科学研究证明,与单视图学习方法相比,多视图学习方法对新样本适应能力更强、更有效。然而,现有的大多数多视图聚类算法只能处理单一类型属性的数据。本文在多视图学习框架的基础上,综合考虑混合属性数据的取值特点和分布特征,提出了两种新的多视图聚类算法对混合属性数据进行聚类分析。(1)本文提出了混合数据的多视图聚类算法MKP(Multi-v
学位
行为识别是视频理解领域中的一个重要分支,其目的是通过识别一段视频中包含的行为进而分析视频中人的意图以及预测其下一步的动作。随着计算机硬件技术的快速发展,可穿戴的电子产品逐渐走入各个领域,为各个领域提供了大量第一人称视频数据。由于通过对第一人称视频数据进行分析可以实现对穿戴者的实时监控和状态检测,因此第一人称视频的行为识别算法在智慧课堂、智慧康养、自动驾驶、虚拟现实等相关领域具有广泛的应用价值。针对
学位
派生性妨碍了身份权在立法上被统一确权,诱发身份权保护漏洞填补机制失范。但派生性也提示了一条因循身份权与基础性人格权之间派生关联性的分类确权进路,即依据获益性身份权、利他性身份权与互益性身份权的不同派生条件,分别厘定其对维护有关身份关系所必须的权利内容与保护范围。由此,也澄清了《民法典》第1001条中关于身份权利保护“没有规定”“可以根据其性质”参照人格权保护规定的法教义,明确了司法裁判中关于身份权
期刊