图像识别技术在陶瓷基片抓取系统中的应用研究

来源 :西安科技大学 | 被引量 : 0次 | 上传用户:nannana001
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在现代工业生产中,随着生产效率的大幅度提升,传统的人工生产方式越来越不能满足现代化制造业的需求,现代化的生产方式需要一种全新的自动化技术,机器视觉技术应运而生。机器视觉应用图像识别技术代替人眼来做测量和判断,效率更高、精确度更好、客观性更强,且可以无休止的重复进行,大大提高了生产的自动化程度。本文对图像识别技术在机器视觉抓取系统中的应用进行研究,研究陶瓷基片识别和位姿获取算法实现抓取,具有一定的实际应用价值。
  在陶瓷基片目标识别方法研究方面,本文首先研究了基于Hu不变矩与KNN算法的目标识别方法,并基于该方法存在的不足提出了以黑色像素面积占比、质心到边缘距离均值以及质心到边缘距离方差作为特征参数的识别方法,实验结果表明,后者计算量小、运行时间快,且能更精准识别陶瓷基片的正反面。由于上述两种方法均不能对目标对象相互遮挡的情况进行准确识别,本文进一步研究了基于边缘的模板匹配识别算法,并在原有相似度量基础上提出了增加基于灰度值差值的倒数作为纠正项的改进方案。实验结果表明,改进后的算法不仅具备精准识别正反面的功能,而且成功解决了目标对象相互遮挡的情况,且适用于多种复杂遮挡情形,符合实际应用场景需求。
  在陶瓷基片目标位姿获取方法研究方面,本文首先对获取最小外接矩形的两种方法:矩形包络法和旋转卡壳法进行了比较,并基于这两种方法获取的最小外接矩形计算出对应的目标质心坐标和旋转角度数据。通过对这些数据的比较分析,最终验证了基于矩形包络法获取最小外接矩形,并以此获取陶瓷基片目标位姿数据的方法更适合实际应用场景。
  最后,将选择的目标识别算法和位姿获取方法应用在实际系统中,并与机器视觉软件Sherlock的实际应用性能进行比较,比较结果表明,本文研究的目标识别算法和目标位姿获取方法,稳定可靠、鲁棒性强,具有一定的实际应用价值。
其他文献
细胞周期蛋白依赖性激酶(CDKs)和许多其它蛋白质控制着植物细胞周期的进程,在真核细胞周期的调节中起主要作用。CDKs的活性可被一些称为KRP(kip相关蛋白)的细胞周期蛋白依赖性激酶抑制因子所抑制。据报道,在叶片发育过程中KRP1会导致细胞数目减少,同时也会显著降低种子的灌浆充实度。此外,KRP1参与细胞核DNA复制及籽粒灌浆有丝分裂终止的调控过程。  为了进一步阐明KRP1的功能,实验室构建了
学位
本文介绍了催化剂应用于汽车尾气排放控制的发展过程和催化反应理论知识。采用新的合成方法和新的配方,制备了包括Cu-ZSM-5、Cu-TS-1、贵金属催化剂和全铂催化剂在内的多种用于柴油机尾气NOx控制的催化转化陶瓷。考察了催化剂在柴油机实际尾气环境下对NO的催化转化性能和耐久性情况。分析了多种因素对催化剂催化效率的影响,对NO在Cu-ZSM-5表面的催化反应机理和反应动力学方程进行了分析推导。试验结
学位
对于患有严重听力障碍的人群来说,可以使用人工耳蜗(cochlear implant,CI)实现听力的部分恢复,虽然CI可以帮助听障用户在安静环境下获得高水平的语音理解表现,但在复杂的听觉场景中,CI植入人群对于感知语音往往存在较多的挑战。在实际的收听环境中,听众首先需要解析所有收听到的声音,之后将这些声音分组为不同的听觉流,并有选择地关注感兴趣的声音流。因此,对于听觉流的分离能力,将会严重影响听众
随着对包括高效调制技术在内的复杂无线移动应用的需求不断增加,对支持这些应用的大带宽的需求也急剧上升。然而,带宽资源是有限的。当前联邦通信委员会频谱分配政策仅允许许可用户访问频谱。但事实证明,当前许可频谱在时间和频率上的使用效率低下。因此,提出了无执照的二级用户概念,他们临时从现有的一级许可用户处租借频谱来提高频谱利用率,即从“频谱池”中租借频率。该项技术是基于动态频谱接入的(DSA),被称为认知无
随着社会信息化程度的不断深化使得对于通信网络的吞吐量及、时延及连接数等性能要求越来越高,这也驱动着通信基础设施及用户设备的持续更新,通信技术也日新月异。其中,大规模多输入多输出(Massive MIMO: Multiple Input Multiple Output)系统是第五代(5G)蜂窝通信系统关键技术之一。大规模MIMO可以通过提供大的空间复用和分集增益来提高性能,被认为是未来通信系统提高数
深度学习是基于人工神经网络的机器学习方法的一种。深度学习具有不同的架构,可应用于计算机视觉,语音识别,自然语言处理等领域。首先,我们研究了基于人工神经网络的深度学习模型。另一方面,神经网络是在输入和输出层之间具有多个层的深度神经网络。这些深度神经网络用于计算机视觉。深度学习具有很强的学习能力,可以从数据集中提取特征。在这些深度神经网络中,一个网络称为卷积神经网络。图像分类是机器学习中的一个重要问题
本文在电信和语音识别系统中考虑了自适应滤波算法的语音增强和降噪问题。在真实嘈杂的环境中存在这些系统会降低其效率并降低其性能。例如,对于电信系统,背景噪声信号破坏传输的语音信号并使其可懂度和质量降低。对于语音识别系统,它们使测试和训练语音信号之间不匹配。  过去已经提出了几种单麦克风增强技术,这里将对其进行讨论。这些技术中的大多数基于噪声平稳性的假设,但是在现实生活环境中,该假设未被广泛验证,这使得
学位
人类语音不仅提供了口语的语义信息,而且还包含了说话者的性别、年龄和情绪等相关特征。在过去十年中,语音识别由于许多原因已经变得必不可少。其中一个原因是它可以用于移动设备的身份识别和准入控制。另外,它还可以通过识别刑事案件中的嫌疑人来最大限度地减少嫌疑人的数量。此外,语音识别系统还可以用于推荐系统来基于人的年龄和性别推荐合适的商品。本论文所设计的年龄和性别识别系统,还可以进一步用于关于特定人群年龄和性
合成孔径雷达差分层析(Differential Synthetic Aperture Radar Tomography, D-TomoSAR)技术是近年发展起来的一项新的空间对地观测技术,它可进行高精度多维成像获得地表的高程以及形变信息。目前,该技术已在地质灾害预警、地球物理参数反演以及城市规划等领域得到了广泛的应用。与此同时,当前星载SAR系统正朝着多平台、多模式、高空间分辨和高重访率方向发展,
双目立体视觉技术作为一种主动测距方法,广泛应用在自动驾驶、虚拟现实、医学成像等领域中。由于制造误差、电路噪声等原因,双目相机实时采集的图像对存在着畸变、噪声污染等干扰,这些干扰会使得立体匹配效果变差。为了生成高质量、高实时性的图像对,本文在对相关理论进行研究分析后,优化、改进了图像畸变矫正算法和中值滤波算法,设计了基于FPGA(Fie1d Programmable Gate Array)的双目立体
学位