【摘 要】
:
在现实世界中包含有复杂的语义信息,而计算机视觉这一学科,所研究的主要内容就是使计算机从现实世界中感知到语义信息,并进行学习,利用这些信息去认识世界。目标检测是计算机视觉研究中的热点问题,其主要任务是对图像中的目标进行精准的分类和定位,可用于自动驾驶、辅助医疗、军事领域的异常目标检测等场景。由于场景复杂且变化繁多,现有的目标检测算法很难满足真实场景下的需求,即泛化性和鲁棒性差,本文的研究着眼于目标检
论文部分内容阅读
在现实世界中包含有复杂的语义信息,而计算机视觉这一学科,所研究的主要内容就是使计算机从现实世界中感知到语义信息,并进行学习,利用这些信息去认识世界。目标检测是计算机视觉研究中的热点问题,其主要任务是对图像中的目标进行精准的分类和定位,可用于自动驾驶、辅助医疗、军事领域的异常目标检测等场景。由于场景复杂且变化繁多,现有的目标检测算法很难满足真实场景下的需求,即泛化性和鲁棒性差,本文的研究着眼于目标检测技术中的语义信息。在语义信息研究的基础之上,做了如下工作:(1)通过构建多重恒等映射,可以平滑地将语义信息传递到深层。提出了一种新型的主干网络Pre-Re Net,解决了普遍存在的退化问题。为解决样本不平衡问题,构建了一种用于进行梯度的权重分配的新型损失函数。并基于这二者设计了一个名为B-Pes Net的新型目标检测网络,对复杂场景有良好的鲁棒性。(2)提出了一种新式的感兴趣区域对齐方式来探索上下文语义信息。这种对齐方式可以使神经网络模型学习到密集的上下文语义信息。在区域建议网络之后设计了一种名为局部上下文语义网络的子网络,将神经网络学习的重点聚焦于目标和其周围局部的上下文。通过这两种结构,基于B-Pes Net构建了B-Pes LCNet,解决了普通检测器在上下文语义复杂的场景下泛化性低的问题。(3)设计了一种量化网络对于同现特征敏感程度的指标。基于这个指标设计了多种数据增强策略,从数据的角度降低模型对于同现特征的敏感度,提高模型在复杂场景下的健壮性,以适应多种应用场景,提高实用价值。(4)基于以上算法研究,设计并实现了一种印制电路板缺陷检测的系统,证明了算法的有效性,并将潜在的应用价值显式地表现出来。通过以上理论研究与严谨实验,证明本文提出的方法在复杂场景下具有良好的泛化性。相比YOLOv5等先进检测算法,B-Pes Net精度平均提高了2%。而加入了金字塔式对齐和局部上下文语义网络的B-Pes LCNet精度则平均提高了3%。在使用基于同现特征的数据增强策略进行增强之后,B-Pes LCNet的鲁棒性指标下降了10%,精度则再次提高了3%左右。综合来看,本文提出的目标检测算法在精度方面优于YOLOv5等先进算法。对于复杂场景下的大目标、小目标均具有较强的检测能力。
其他文献
为解决传统苹果糖度、酸度判定方法多为破坏性检测从而影响销售和食用的问题,本研究从无损检测方面入手,依据近红外光谱定量原理,以红富士苹果作为研究对象,苹果糖度作为检测指标,光电技术为依托,研究设计了基于国产智能手机的实时、快速、低功耗、低成本的苹果糖度无损检测系统。该检测系统具有高效、快捷、无损等特点,在苹果糖度检测方面就有很高的实用价值。
老龄化的不断加剧,不仅阻碍了社会保障制度的可持续发展,也带来了劳动力短缺的问题。为了维持社会经济的活力,提高老年人就业率不失为一种解决之策。随着老年人就业率的提高,原本需要社会保障制度支撑的人群可以转化为支持社会保障制度运转的人群,从而缓解社会保障制度的财政问题。因此,许多老龄化相对严重的国家采取各种措施促进老年人就业。其中,日本从上世纪九十年代便开始从公共年金制度入手为提高老年人就业率而实行了各
<正>法国思想家帕斯卡尔说:"人只不过是一根苇草,是自然界最脆弱的东西,但他是一根能思想的苇草。"人,是脆弱的,"一口气、一滴水、一束光,就足以致命",但人也因为有思想而伟大,"我们全部的尊严就在于思想"。浩大的宇宙,随时可以毁灭脆弱渺小的人;人却因为有思想,可以胸怀宇宙,可以"不畏浮云遮望眼",不因人生旅途上的困顿
大中小学思政课一体化建设关系到能否建设一支高质量的思政课教师队伍,是思政课教师队伍建设的重要内容,是思政课教师队伍建设必然要求。在当前的新形势下,在促进思政课内涵式发展中还存在着一些问题,导致思政课发展困难,例如思政课一体化建设中思政课教师数量不足、质量不高、培养体系不完善、缺乏制度保障的问题,针对这些情况,需要从整体出发,用大局观念来解决这些问题。所以要构建一个完善的思政课一体化建设体系,要从源
核能是我国乃至全球重点发展的清洁能源,而核电作为核能的应用方向之一,对电力产业的发展有着积极推动作用。核能发电的关键是核反应堆堆芯安全稳定的运行,而核反应堆堆芯有效运行的前提是燃料组件精准的装卸定位。目前燃料组件的装卸操作存在流程复杂、安全隐患高、人工误差大等问题。随着图像处理算法和光学传感器的高速发展,拥有精度高、实时性强、非接触式等特性的机器视觉技术逐渐被应用于某些特定工业领域。鉴于此,本文针
日本年轻一代否定了“男主外,女主外”的传统性别角色分工,意识发生了转变。此外,随着女性在社会上日益活跃,双收入家庭的数量正在增加,男性的家庭参与度(活跃度)的提高值得期待。根据厚生劳动省就业环境与均等局的数据,丈夫做家务和育儿的时间越长,妻子的持续就业率越高,二胎后的生育率也越高。这将有利于解决日本少子化和劳动力短缺的问题。但是,实际数据显示,日本的男性做家务和育儿时间远少于配偶,使用育儿休假制度
近年来,以滴滴打车为代表的共享经济迅速发展,给每个人的日常生活带来了很大的便利。用户在享受共享经济服务的同时,也对共享服务质量产生了影响。例如,滴滴打车会给每个乘客在乘车之后进行评分,评分较低的用户可能会影响他们后续的打车服务质量。可见,分析用户在互联网共享服务中的行为合规性有助于进一步提升服务水平,已成为共享经济研究中的一个热点话题。本文指出了现有的服务质量(Quality of Service
新型冠状病毒肺炎(以下称“新冠肺炎”)在日本境内出现后,日本从中央政府到地方自治体都采取了一系列应急防控措施。日本中央政府在面对突发公共卫生事件时有其独特的应急管理体系及协调机制。在疫情下,以近邻日本为借镜,观察其疫情应急防控的经验教训能进一步开阔视野,有助于使应急防控更加科学有效而有弹性。本文以日本中央政府应对第一波新冠肺炎疫情的政策措施为例,梳理日本中央政府应急管理在实践中的不足之处,并总结可
情绪识别是分析人们在感觉、思想和行为等方面所表现出的意见、观点和态度的一种有效方法。情绪识别在很多场景有着具有重要作用,例如在线面试和辅助医生检测用户的情绪状态。通过手机等设备可以更方便地对用户情绪进行观察与分析。人们表达情绪的方式是综合的和多方位的,单模态情绪识别无法利用这些信息来更全面分析情绪,而采用多模态情绪识别,可以更多维度地识别情绪。因此,采用多模态融合的方式识别出情绪类别,并迁移至手机
在当今社会和环境问题日益严重的背景下,人们越来越迫切地需要企业积极开展CSR活动,以期实现各利益相关方的和谐共处及可持续发展。这就是所谓的企业社会责任。这一趋势从2020年初起变得尤为明显。随着新型冠状病毒疫情的愈演愈烈,社会各方都在期待企业积极参与CSR活动,参与解决疫情下出现的各类问题,以期尽快缓解疫情,减少损失。然而,公司是由利润驱动的组织。所谓的“社会责任”概念有时只是道德层面的企业自愿行