基于无监督学习的木地板缺陷检测方法研究

来源 :北京交通大学 | 被引量 : 0次 | 上传用户:zjcmlyj
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着我国房地产行业的繁荣,装修行业也迎来了黄金时期。由于木地板在脚感,静音性及安全性等方面的优势,越来越多的家庭在室内装修选择地板时会优先考虑木地板。然而,随着生活质量的提高,大众对其品质要求也越来越高。因此,缺陷检测成为生产流程中必不可少的环节。木地板的生产流程是一个复杂的复合过程,在很多环节都可能产生缺陷。目前,大部分企业采用人工检测方式,该方法效率低、成本高、无数据追溯。因此,企业迫切需要通过智能化的方案去解决这个问题。无接触视觉检测方案作为一个比较好的替代方案,可以极大的减少人力成本。在无接触视觉检测方案中应用最广泛的是基于深度学习的缺陷检测,相比于传统的图像处理检测算法,基于深度学习缺陷检测方法有更好的性能,更符合工业要求。目前大多数方法都是基于有监督学习的缺陷检测方法。该方法需要大量有缺陷的样本数据,而实际场景中缺陷数据是及其缺少的,这使得监督学习方法模型检测效果不稳定。而且在实际工业场景下缺陷是不可预见的,缺陷类型是无法枚举的,这近一步导致基于有监督学习缺陷检测方法很难满足于实际工业要求。针对以上问题,本文的主要工作和创新总结如下:(1)提出了一种基于生成对抗网络和变分自编码器的图像重构模型(MVAEGAN)。本文结合了生成对抗网络与变分自编码器各自的优点,以真实的木地板数据为基准,通过设计合理的损失函数以及网络模型结构,使模型既稳定又能保证生成图像的合理性。通过训练无缺陷样本,使其学习无缺陷样本潜在特征信息,并使其具有正常样本的重构能力,为无监督学习的木地板缺陷检测算法提供模型支持。实验采用真实木地板数据,并使用图像质量评价(IQA)作为图像好坏的判定指标。针对真实木地板样本,在MVAE-GAN、GAN和VAE三种模型下分别进行了图像重构。实验结果表明,本文所提出的MVAE-GAN模型在结构相似性、峰值信噪比等各项指标中均优于GAN和VAE模型。(2)提出了一种多模态的无监督木地板检测算法。由于实际木地板生产环境中缺陷不可预见、偶发、不可枚举等特点,有监督缺陷检测算法无法满足实际生产要求。本文提出了一种新颖的无监督木地板检测算法。网络模型基于图像重构的思路,通过构建输入图像与生成图像的残差图,设计符合木地板缺陷判定的合理阈值,从而实现缺陷检测。为提高模型的鲁棒性和检测精度,本文引入了多模态结构,并对比了多模态结构与单层模型算法的性能,结果表明,相比于单层模型检测算法,多模态检测算法的误检率降低了大约7%。
其他文献
随着人工智能、机器人技术的不断发展和变革,机器人正逐渐进入人类生产生活的各个领域,机器人操作系统(Robot Operating System,ROS)因此得到广泛的应用并受到学术界和产业界的共同关注。其中,ROS安全测试与验证成为机器人操作系统研究领域的热点问题之一。通信机制作为ROS最基础的功能,在保证系统的正确性和安全性方面具有不可替代的作用。进一步说,ROS安全不仅应当从仿真和测试出发来进
移动机器人已广泛应用在医疗服务、餐饮行业、物流运输等领域,先进的机器人技术逐渐代替人工作业。移动机器人的路径规划与轨迹跟踪是机器人自主导航的关键技术,其运动路径是否平滑影响着机器人的移动效果,能够生成符合车辆运动学的可行路径并且稳定跟踪控制是实现的移动机器人自主导航的基础。本文从移动机器人的实际问题出发,以松灵SCOUT通用型底盘为实验平台,在工控机上安装Ubuntu系统,搭载16线激光雷达和IM
随着移动机器人技术的飞速发展与相关研究的逐步深入,移动机器人拥有了更加广阔的应用背景,由此对其结构和功能提出了更高的要求,期望移动机器人具备一定的环境适应性以应对复杂的工作环境。移动机器人的越障能力测试是移动机器人研究过程的关键一环,然而在传统的越障能力测试试验当中,常规方法是让移动机器人跨越特定参数的障碍试验台,再通过人工判定的方式测试其越障性能。由于特定参数的障碍试验台不能根据越障试验需求快速
随着现代电力系统的快速发展,新能源大规模并入电网,特高压交直流混联趋势日加明显,电网互联程度日趋紧密,这使得电力系统规模不断扩大,复杂性大幅提高,愈发接近安全稳定运行极限。且现代电力系统高维非线性,故障发生速度快,响应时间短,这无疑加大了暂态稳定预测的难度。为给故障后的紧急控制留出充足的时间裕度,亟需一种更加快速准确的暂态稳定预测方法。近年来,以数据挖掘和机器学习为代表的人工智能领域得到了迅速发展
随着精神生活的日益丰富,人们对观看电影、电视剧的娱乐需求逐渐增加,以微电影、情景剧为代表的网络短视频也呈爆炸式增长。在这一环境下,预测观众在观看影视作品时视线聚焦的位置变得十分有意义,例如,对于广告公司来说,通过视频中的注视点分析,可以将广告产品在视频中的位置设定的更佳合理。依据观众是否提前知道影片的相关信息,观看方式可分为自由观看和视觉问答两种。现有的动态场景人眼注视点数据集几乎都不是针对影视作
细粒度图像分类在工业界应用广泛,然而,传统的图像分类网络在细粒度图像的分类问题上往往无法达到很好的效果,因为在细粒度图像的数据中经常会出现高类内差,低类间差的情况,加之图像数据的质量参差不齐,图像中存在的噪声往往会掩盖图像内部的细节特征,因此细粒度分类问题十分具有挑战性,也引起了广泛的关注。然而细粒度图像分类网络运用于工业仍面临挑战。在目前的研究中,强监督的细粒度分类网络虽然有着较高的准确率,但却
联邦学习是一种新型的分布式学习框架,它能够解决数据在本地训练而不会泄露的问题,但是它也面临一些前所未有的安全和隐私威胁,例如在传统机器学习中的投毒攻击可以很容易的在联邦学习中实施,因为本地数据对外不可见,恶意的参与者就可以轻易对数据进行篡改实施投毒攻击。另外由于服务端与本地客户端通过模型参数进行通信,恶意的参与者可以直接获取到参数,通过对这些参数进行分析,依旧可以在一定程度上泄露私人信息。因此本文
互联网已经迅速成为日常生活中不可或缺的一部分,并且我们对互联网的依赖正在持续增长。与此同时,网络攻击急剧增加,攻击手段日异月更。当前的恶意代码检测技术通常使用传统的机器学习算法,这些算法需要对恶意代码特征进行提取和选择。多数动态分析受执行环境约束,部分恶意代码通过隐藏文件逃避追踪,过程耗时且容易出错。流行的静态分析依赖于人工提取特征,安全性较差,效率较低。面对以上挑战,本文将恶意代码检测结合深度神
基于卷积神经网络(Convolutional Neural Network,CNN)的行人检测研究取得了显著成果,但是目前已有的行人检测技术还不能完全应对严重遮挡的场景。Res Net在特征提取过程发挥了重要作用,因此广泛应用于目标检测等计算机视觉任务。本文针对密集场景下严重遮挡的行人检测问题展开研究,以Res Net为骨干网络,主要包括改进Faster R-CNN的两阶段多尺度检测网络和改进Re
近年来,各个行业对三维模型的应用需求日益增大。但是目前对于三维模型的研究还有很多阻碍,其中最大的困难之一就是三维模型分类方法在算力及存储能力有限的设备上难以正常运行,并且不能满足实时性需求。为了解决这一挑战,本文设计了基于kd-tree、k-means、曲率的点云精简算法和轻量级多视角卷积神经网络点云模型分类算法,并在公开数据集上进行对比实验获得了很好的效果,主要工作如下。首先,针对点云模型分类任