【摘 要】
:
随着机器学习与深度学习的不断发展,计算机视觉已经逐渐成为各大领域持续研究并应用的领域,因此异常检测技术逐渐出现在人们日常生活中的方方面面,尤其是在工业工厂领域,异常检测技术的不断成熟不仅提高了缺陷产品的检测率,减轻了工人的劳动时间与工厂的用人成本,而且极大地降低了工厂因缺陷产品而产生的成本。但是面对异常样本十分稀缺的情况下,如何训练模型来提高检测缺陷产品的准确性就成为了异常检测领域中一个需要解决的
论文部分内容阅读
随着机器学习与深度学习的不断发展,计算机视觉已经逐渐成为各大领域持续研究并应用的领域,因此异常检测技术逐渐出现在人们日常生活中的方方面面,尤其是在工业工厂领域,异常检测技术的不断成熟不仅提高了缺陷产品的检测率,减轻了工人的劳动时间与工厂的用人成本,而且极大地降低了工厂因缺陷产品而产生的成本。但是面对异常样本十分稀缺的情况下,如何训练模型来提高检测缺陷产品的准确性就成为了异常检测领域中一个需要解决的问题。异常检测的目的是为了准确地找出离群点(负样本),即区分出所有样本中的正常样本与异常样本。本文通过训练大量数据,使得模型可以区分出正常样本与异常样本,并定位到样本缺陷所在的位置。支持向量数据描述(SVDD)是一种在特征空间中做异常检测经典的算法,本文对不同种类共十五种工业产品样本来进行研究测试,提出了一种新的基于支持向量数据描述的自监督学习的异常检测模型,并开发了一个实用性比较强的工业产品表面缺陷的异常检测模型。本文的主要工作内容如下:(1)针对工业产品需要定位产品缺陷所在位置的问题,本文提出了一种基于支持向量数据描述的工业产品表面缺陷检测的模型Tune Patch。因为工厂常常有需要定位产品缺陷所在位置的需求,所以本文通过对图像分块来做一个细粒度的检查以获取到异常存在的位置,便于工厂进行有针对性地检查,提高检测效率。实验证明该模型在13类样本上有所提升,尤其是纹理类样本提升很多。(2)为了进一步提升模型检测的准确率,本文加入了VIT(Vision Transformer)模型,并加入了BERT中的MLM任务,提出了VIT Patch和Mask Patch模型,实验证明该模型在对象类上表现比较好;同时为了解决维度爆炸问题,本文在测试的时候于patch embedding之前进行了一次卷积。(3)本文在进行多次实验后,总结出了效果好的算法模型,提出了针对工厂工业零件表面缺陷的异常检测模型,同时设计并实现了工业产品缺陷检测系统。该系统包括用户权限管理模块、模型参数配置模块、模型训练模块以及模型实验模块。用户权限管理模块赋予不同用户使用该系统的不同权限;模型参数配置模块让高级用户有权限配置不同的参数以便更好地训练模型适用不同样本的需要;模型训练模块适用于异常检测系统的研发人员,可以选择训练数据集、看到参数配置、训练数据以及训练结果等;模型训练模块面向两类不同用户,一类是该系统的使用用户即商家,该类用户无需关心模型实现之前的所有细节,只需要得到训练结果即产品表面缺陷存在的位置。另一类面向的则是使用该模型的开发人员,可以看到训练过程的一切数据,便于随时调整模型的参数以适用于不同种类的样本。
其他文献
随着我国资本市场不断发展,上市公司数量不断增多,财务舞弊案件层出不穷,扰乱我国资本市场的同时也造成了投资者的经济损失。进行公司的舞弊识别成为对于上市公司监管的重要任务,有利于维护投资者利益和资本市场稳定。本文将研究目光放在年报文本上,将年报文本中的管理层讨论与分析文段作为研究对象,从多个角度对于年报文本中信息量含量较大的管理层讨论与分析文段进行文本特征提取,加入到舞弊模型中,查看文本特征对于舞弊识
信用风险是信贷业务的主要风险来源。近年来,随着社会经济的快速发展,信用消费的经济形式越来越普遍,违约风险也随之增多。我国目前的信用现状仍存在很多问题,严重的违约风险很大可能会影响社会经济的健康发展。如何准确和全面地对个人信用风险进行评估是银行等金融机构的重要任务和必然要求。传统的信用风险评估方法过于依赖个人征信,缺乏时效性和全面性。大数据时代的到来提供了丰富的数据,加上深度学习技术在多个领域内的成
从上世纪60年代诞生至今,电子游戏产业发生了翻天覆地的变化,特别是伴随着2021年以来元宇宙的异军突起,由于其自身特性与电子游戏的追求不谋而合,使得电子游戏再次受到了人们的广泛关注。诸如寻路及难度预测两大问题对于游戏的设计与开发至关重要。寻路系统是指通过一定算法在最短时间内,为角色找到一条从起点到终点、无碰撞的最短路径。因为寻路的效率影响游戏智能体决策的能力,因此寻路系统的优劣在很大程度上决定了最
随着互联网行业的发展,金融机构信息化转型的需求也越来越大,互联网金融业务应运而生。互联网金融业务改善了传统金融交易模式,促使金融业的发展和变革。然而,大量互联网金融业务的涌现也直接导致了风险问题的集中爆发。信用卡欺诈、贷款逾期、贷款坏账等不良金融事件时常发生。为了维护经济市场秩序,保障金融行业持续发展,我国政府高度重视互联网金融业务出现的问题,颁布相应法律法规等文件,针对风险问题开展专项整治工作。
在金融市场中,波动率作为衡量金融资产价格波动剧烈程度的指标,对于刻画金融市场中的风险有着重要指导作用。相比以日、月为单位的低频数据,以秒、分钟、小时为采集频率的日内高频金融数据,不再服从正态分布假设,整体上呈尖峰厚尾性质。较高的采样频率,使得高频金融数据能够对市场微观结构进行更准确的预测,因此,大量学者展开了对高频金融数据波动率的探索。在计量经济领域,学者们尝试采用参数估计方法,描述高频金融数据的
智能客服系统是任务型对话中的一个重要应用。智能客服系统相比人工客服而言,解决问题能力更加高效,而且成本更低,因此受到了工业界大量企业的亲睐。比如在电商领域,阿里小蜜、京东小咚等产品都是典型的智能客服系统。在政务客服领域,同样需要智能客服助力。目前,很多政府部门都提供了智能客服系统,比如北京政府的智能咨询机器人“京京”、上海政府的智能客服“小申”等。这些政务智能客服系统可以为公众提供权威的政策咨询服
海冰不仅是全球气候变暖的警示器,同时也是航海的大敌。近年来,利用遥感数据来观察海冰已成为海冰研究的主要方式。图像分割技术作为高分辨率可见光遥感海冰图像研究的基础,其分割效果的好坏将会直接影响到后续研究的结果。由于高分辨率可见光遥感海冰图像的分辨率较高,以像素为单位的分割算法通常分割成本过高,且分割效率低。另一方面,高分辨率可见光遥感海冰图像光谱信息相对不足,部分区域颜色较暗,采用传统的分割算法会将
随着信息技术的发展,线上教学平台和传统课堂都产生了数以万计的数据。由于教育环境的特殊性,这些数据通常具有庞大、多维、异构的特点,不仅包括教育管理系统中的学生基本信息、课程参与、成绩统计、图书阅览等异构数据,还包括了学生使用学习平台所生成的大量点击流数据,如交互数据、学习行为数据等多模态数据信息。虽然这些教育数据中蕴含了大量学习行为信息、交互信息、学习效果评价信息,但是对于没有掌握数据挖掘和数据分析
本文着重于研究层级图表征学习模型,提出了一种改进当前主流层级图表征模型的算法。该算法旨在提升图分类任务中预测分类标签准确率的性能,并通过实验来验证新算法模型的有效性和可应用能力。近年来,针对处理非结构化数据的机器学习方法这一研究受到越来越多的学者关注。不同于结构化数据(如图片、音频、视频等)的固定排列结构,非结构化数据的结构排列是没有固定顺序的,这使得传统深度学习算法无法作用于非结构化数据。因此,
随着人工智能技术和机器人流程自动化技术(RPA)的发展,传统的审计工作面临较大变革。审计自动化、审计智能化与审计数字化逐渐成为未来审计领域的发展趋势。因此,融合人工智能技术与RPA技术对发现企业财务舞弊、提升审计质量与审计效率具有重要意义。传统的审计模式需要跨越多个系统或应用,这些繁琐、重复性强的操作仍需审计人员手动完成,现有研究仅将新技术应用于审计的某一方面或某一特定任务,例如合同分析、收集证据