基于Mask R-CNN实例分割的机械零件识别方法研究

来源 :电子测量技术 | 被引量 : 0次 | 上传用户:cuixy3
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
零件识别是机械部件装配、装箱的重要基础,人工识别效率低,传统机器视觉检测要求高、场景单一。本文提出一种基于深度学习机器视觉的机械零件识别方法,通过加入PointRend模块提升原始Mask R-CNN实例分割模型的检测精度;针对相似度高零件设计类别细分方法,通过尺寸估算与特征匹配,较好地解决由于数据增强图像缩放造成的尺寸特征丢失问题。采集25种不同零件进行识别实验,结果表明:本文方法可有效提升机械零件的识别准确率,算法对相似零件识别准确率达100%,较原始Mask R-CNN方法提升11.51%。并
其他文献
本文针对定位跟踪时不同环境的复杂光照变化特点,提出了一种自适应阈值的ORB特征点提取方法,该方法首先通过自动计算图像块周围的特征点自适应提取阈值,利用该阈值实现图像特征点提取,接着采用水平双目模型进行特征点跟踪。利用数据集在不同环境场景与不同方法进行对比实验对比,实验结果表明本文中改进的方法在特征点提取时具有更大的检测范围,提取速度以及更高的稳定性,并且在轨迹追踪对比中具有更好的RMSE表现。
期刊
针对二维图像无法表征舰船深度信息、舰船紧密排列识别出现误检等问题,改进了MASK R-CNN的模型方法。首先在目标区域方框和类别预测的基础上,合理重建出三维模型;其次在原始的RPN网络中选取级联的方法增加滑动窗口数量,改善感受野获取信息有限问题;同时增加掩膜分支,在描述舰船目标特征的同时,增加对其轮廓边缘的限制;最后结合非极大值抑制的方法对冗余框进行过滤去除,实现对三维舰船实景目标的识别。进行了仿
期刊
色彩恒常性的实现中, 灰度世界算法通常因自然图像间场景差异导致较弱的光源估计性能. 针对上述问题, 提出了一种以场景语义为引导的改进灰度世界算法. 首先, 使用灰度化图像计算稠密SIFT描述子以避免彩色图像偏色干扰, SIFT描述子集合由词袋模型进一步生成无序视觉词汇; 其次, 以视觉词汇对应像素平均亮度为权重, 基于空间金字塔匹配算法构建金字塔结构的亮度加权词频直方图; 然后, 采用直方图交叉核
期刊
文中提出了一种基于先验知识和改进YOLOv3算法的机坪工作人员反光背心检测算法。该方法针对现有目标检测方法速度偏低的缺陷,基于先验知识生成反光背心检测候选区域来替换初始候选区域,以减少检测区域面积,使用Darknet-37替代Darknet-53作为骨干网络进行特征提取,提高了算法的检测速度。针对反光背心在画面中所占面积偏小,且辨识难度较高的问题,在检测模型中加入空间金字塔池化结构(SPP),从而
期刊
轨迹相似度估计是发现车辆运动特征和轨迹分类的关键, 但计算轨迹相似度缓慢, 提高轨迹匹配速度可以帮助展开轨迹特征的快速挖掘, 因此提出一种基于空间坐标系旋转的高效轨迹匹配算法. 首先利用空间坐标系的多次旋转, 将轨迹曲线转换成点数等于旋转次数的平均数和方差曲线; 使用Fréchet距离和皮尔森相关系数衡量平均数曲线间相关性和方差曲线间相关性; 最后根据Fréchet平均数、Fréchet方差、皮尔
期刊
生命科学的发展一直伴随着显微技术的创新,基于超快光学的单分子相干调制显微成像技术在量子力学的理论基础上,通过结合超快光学和显微技术从而使微观生物的量子现象的观测成为可能。这篇综述首先介绍了单分子相干调制显微成像技术通过飞秒激光脉冲对实现了单分子量子相干态的操控,并通过调制解调技术获得单分子周围相干信息的基本原理,然后分别介绍了其在生物方面的两个应用:(1)通过降低生物自荧光和背景噪声,实现了生物成
期刊
针对采集到的桥梁裂缝图像存在污渍、阴影、光照不均等现象,导致后期裂缝特征提取困难的问题,提出一种结合MASK匀光和K-means聚类算法的裂缝提取方法。该方法首先对MASK匀光算法进行改进,提高算法自适应能力,采用对比度拉伸增强图像反差,然后根据裂缝与背景像素灰度值的差异,利用K-means聚类算法进行图像分割,最后结合形态学方法和连通域检测实现裂缝的桥接和去噪。实验结果表明,相比于其他方法,该方
期刊
为探究不同气候条件下土壤水力参数对土壤水长程相关性的影响,利用HYDRUS-1D模型,以湿润、半干旱和干旱气候区的气象数据为驱动,结合生成的砂土和黏壤土土壤水力参数集,模拟生成土壤水时间序列集;而后,利用去趋势波动分析法对生成的土壤水数据进行长程相关性分析。结果表明:(1)土壤水标度指数(h)介于0.570~1.915,土壤水中存在显著的长程相关性。砂土中土壤水变化主要表现为持续性,黏壤土中持续性
期刊
针对人工处理重复供电安全管控图像效率低的问题,在感知哈希算法(perceptual Hash algorithm,PHA)的基础上,给出了基于分块离散余弦变换(block discrete cosine transform,BDCT)的PHA,简称BDCT-PHA。采用BDCT-PHA进行图像去重操作,该算法可对经过JPEG压缩的图像进行处理,具有较高的去重准确率和较低的误判率。然后,改进ResN
期刊
针对鬼成像重构效果差所导致目标信息难以有效凸显的问题,结合自编码神经网络降噪优势,提出了一种鬼成像优化方法。该方法以手写数字数据集为样本,在对探测数据进行二阶关联获得初始鬼像的基础上,构建了一个降噪网络模型。该网络模型采用Leaky relu线性激活函数来解决网络的过饱和和单元死亡的问题,并通过10000个测试样本集验证了所提网络模型的有效性。通过对不同采样率下优化前后鬼像的质量进行了对比分析,分
期刊