基于视觉注意力机制的金属表面缺陷图像分割算法研究

来源 :昆明理工大学 | 被引量 : 0次 | 上传用户:wormchen
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
金属作为制造业的支柱产品之一,金属的质量优劣影响着终端产品的质量。金属表面缺陷检测是金属质量控制的重要一环。金属的表面缺陷检测中,基于机器视觉的检测技术已经成为主流。机器视觉本质上是模仿人类视觉系统,现在表面缺陷系统中硬件设备已经较为成熟,因而图像处理技术成为研究重点,其性能决定着整个缺陷检测系统的性能。金属表面缺陷图像存在着,缺陷和背景对比度低,缺陷类型和尺寸差别大等问题,同时还存在高光和阴影干扰。为了解决以上问题,本文针对金属表面缺陷的分割算法进行了研究,通过结合视觉注意机制,模拟人类注意力系统,在图像分析及分割过程中节约计算成本,提升算法的分割效果。本文研究主要过程如下:(1)针对金属表面缺陷数据集缺乏的问题,设计了针对铜带表面缺陷的数据采集制作方案,完成数据集的标注,建立铜带表面缺陷数据集(Kmust-DET)。然后提取图片四种主要特征,采用三类贝叶斯分类器进行特征分类,通过分类结果可发现所设计的数据集图片质量稳定适合作为研究目标。(2)基于视觉注意机制的传统分割算法研究,首先采用改进的Retinex算法对金属表面缺陷图像进行灰度矫正,后利用改进的全局和局部信息计算生成显著图,并进行显著图融合,然后选择最优阈值对图像进行分割。对本研究方法进行实验验证,证明该方法具有较好的鲁棒性和有效性。(3)基于视觉注意机制的语义分割算法研究,针对金属图像特性和语义分割架构的缺陷,对注意力生成模块进行研究。在算法不同的处理阶段融合不同的注意力模块生成信息,改进了算法的主干网络,并增加了分支网络,提出一种新的金属表面缺陷分割方法。根据实验结果表明,该分割方法效果稳定,准确度达到91.34%。
其他文献
图像融合的目标是将来自同一场景的多幅源图像的互补信息进行融合,生成高质量合成图像。红外图像反映的是目标在红外热辐射下的能量分布,不易受风沙烟雾等复杂条件影响,但其可视性并不是很理想,特别是物体纹理细节信息表现较差。可见光图像主要与目标场景的光反射有关,物体辨识度高,但容易受到外部环境的影响,特别是被遮挡时就无法准确地捕捉目标特征信息。所以,红外与可见光图像融合能够综合两种成像的优势,通过结合二者的
钢水碳含量终点预测作为转炉炼钢重要的一环,准确的预测将直接关系到炼钢效率,有利于减少能源和原材料浪费。由于熔池内不同比例的钢水碳含量能够反映在炉口火焰颜色、纹理形态等信息的变化上,因此采用炉口火焰图像特征提取的终点碳含量预测方法为传统预测提供一种新的参考,但火焰作为一种复杂变化的非结构对象,具有较强的随机性和相似性,给特征提取带来不小的困难,进而影响到终点预测的准确性。针对上述问题,本文将从钢水碳
转炉炼钢生产过程中,终点碳温的准确预报是钢铁产业至关重要的一环,而碳含量的准确预报对于提高钢铁冶炼工艺具有重要的意义。本文针对转炉终点炉口火焰图像相似性高,传统特征方法难以提取区分碳含量相近的火焰图像的关键特征,从炉口火焰图像的颜色特征和纹理特征提取入手开展研究,为提高基于炉口火焰图像特征提取的转炉炼钢终点碳含量预测准确率打下基础。本文的主要研究内容如下:(1)采用基于卷积神经网络火焰特征提取的终
行人重识别是一种利用计算机技术判断摄像机收集的视频或图像中是否存在特定行人的技术,可以自动地对多个不交叉摄像机捕捉的行人图像进行匹配,因而在智能监控系统中发挥着显著作用。但现有的大多数行人重识别方法是在单个有标记数据集上进行训练和测试的,如果在源数据集上训练的模型直接应用到目标数据集上会产生因行人图像风格差异等因素引起的域偏移问题,从而导致最终的识别精度很低。现实场景中已标记的行人样本是极度缺乏的
在当今信息时代的背景和进程下,作为信息技术载体和媒介的印刷电路板(Printed Circuit Board,PCB),从我们日常生活中经常接触和使用的手机、电脑等各类电子产品,到军事中的飞机、卫星等领域都有着广泛的应用。由于工业生产中对PCB更高的要求加之现在的电子产品高度的集成化,PCB板的生产更加细化、走线结构更加复杂,从而导致PCB板带有缺陷的概率大大提升。PCB板必须保证线路连接、线距以
纤维结构是存在于太阳色球层中的一种呈现出喷射状态的线性拉长结构,研究色球纤维的动力学特征能够帮助人们对太阳大气质量平衡以及针状体的演变过程进行更进一步的研究。进行纤维结构动力学特征的研究的前提是对太阳色球纤维进行准确的识别和提取,因此选择一种高效准确的识别方法是当前人们的关注重点。在进行色球纤维识别前,我们首先对纤维图像的特点进行了分析研究,发现当前纤维识别的难点以及存在的问题仍然有许多。因为在色
预测和推理未来结果的能力是智能决策系统的关键组成部分。近些年,以深度学习为代表的机器学习预测算法取得迅猛发展,广泛应用于天气预报、自然灾害预警、疾病诊断等领域。然而,在太阳光球磁场演化研究方面,由于缺乏完备的数据集和全面的评价标准,以及演化过程中存在磁结构运动、形变、浮现、消失等多种复杂变化交织的问题,使得直接在时间和空间上预测磁场的演化过程具有较大挑战,所以目前尚无对太阳磁场的演化过程进行预测研
随着我国网络技术普及度的加深,网络社交媒体中产生了海量的带有情感色彩的文本数据。研究者们根据情感表达中是否含有情感词,将其分为显式情感表达和隐式情感表达,由于我国网民更倾向于通过含蓄的方式来表达情感,所以中文的隐式情感表达数量非常庞大。对这些海量的隐式情感表达进行分析,是情感分析研究中不可或缺的重要部分,在舆情分析、升用户体验以及改进服务和产品质量方面,具有广泛应用场景和重要研究意义。本文对源自社
随着电子商务的快速发展,服装市场的潜在价值也在逐步显现,针对服饰检索、服饰识别和服饰推荐等计算机视觉领域的研究出现一系列研究任务。我国有55个少数民族,民族服饰种类繁多,服装结构复杂,语义属性丰富,能够将服饰图像检索技术与民族服饰文化相结合,对民族服饰实现数字化,这对传统民族文化保护具有重要意义。民族服饰图像具有不同民族风格的服装款式、配饰和图案导致的民族服饰图像细粒度检索准确率较低的问题,本文提
近年来,法院工作已经成为互联网媒体和舆论关注的焦点,来势汹涌的网络舆情给法院工作造成了巨大的压力。面向案件微博评论的情绪分析有助于法院等相关部门及时了解和掌握案件微博舆情,然后进行舆情监控和传播引导。面向案件微博评论的情绪分析属于特定领域的任务,存在没有公共数据集、情绪表达具有领域性等研究问题,值得深入研究。本文研究面向案件微博评论的情绪分析方法,主要从以下几个方面开展研究:(1)案件微博评论情绪