复杂起重装卸场景目标物的实例分割方法研究

来源 :广东工业大学 | 被引量 : 0次 | 上传用户:qqqqq721106
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文针对在研发“无人化起重装卸智能测控系统”项目中关键技术需求——装卸目标物的自动识别及定位测量,研究复杂场景下目标物的实例分割技术,为起重装卸智能化提供关键技术支撑。机器视觉是对目标物进行识别及测量的比较可行的技术。但由于起重装卸场景所处环境和装卸目标物往往十分复杂,存在大量未确定因素,使该技术应用陷于巨大的困境,其中主要是实例分割的实现难度。目前实现高准确率的实例分割技术均基于有监督的深度学习。本文依据项目实际需求研究目标物深度学习实例分割技术,拟实现两个目标:一是标注数据集生成方法,实现通过标记少数样本来构建大型高质量标记数据集,解决训练数据匮乏问题,为利用有监督学习模型提供充足的数据支撑;二是复杂场景下目标物的实例分割方法,实现目标物准确识别,为精确定位测量提供基础。具体研究工作和取得的成果如下:1、针对起重装卸目标物标注数据匮乏问题,设计了一种生成对抗网络,构建准确的含语义标注和关键点标注的数据集。以DatasetGAN作为基础网络,针对实际应用中存在的问题进行改进,包括:(1)语义特征变形问题:将生成器的样本归一化层进行修改,去除均值操作,修改噪声模块和样式控制因子的输入方式;(2)对起重装卸纹理特征单一的目标物的空间位置编码能力弱的问题:将生成网络的常数输入替换为傅里叶特征,并提出一个融合非线性上下采样的模块;(3)目标函数:引入WGAN-GP目标函数消除在判别装卸目标物数据与真实数据分布时容易发生梯度消失的现象。应用实验合成标注数据集,使用Deeplab-V3作为评价网络,以DatasetGAN方法作为基线进行测试的结果为:在语义标签生成任务上,Deeplab-V3输出mIOU值提高14.83%;在关键点标签生成任务上,L2损失平均降低0.4×10-4,PCK值平均提高5.06%。验证了改进的生成对抗网络生成语义及关键点标注数据的可行性和先进性。2、研究构建了一种复杂起重装卸场景下的实例分割主干网络。通过剖析现有实例分割网络的特征提取主干网络,针对强化主干网络对复杂起重装卸场景的远程相关性编码和深度线索编码能力,构建了CNN和Swin Transformer两分支并行结构,然后设计了一个融合模块使异构特征信息充分融合。构建的主干网络能有效在复杂装卸场景下完成强健的语义特征信息和空间特征信息提取。3、研究构建了一种复杂起重装卸场景下的实例分割检测网络以提高分割掩码准确率。首先以Dense Rep Points生成实例的多边形而不是掩码,然后应用一个Transformer多边形变形网络进行更深入的边缘轮廓细化。该网络为多边形预测每个顶点的位移,同时考虑到所有顶点的位置。通过变形多边形,所建模型能够更好地学习捕捉对象的局部几何形状,且有更精确的掩码。复杂起重装卸场景下实例分割主干网络和检测网络组成的实例分割模型,较于其它方法,其在装卸场景下得到最优的分割效果,AP提高5.64%,达到99.51%;mIOU提升10.36%,达到96.83%。
其他文献
表面等离激元(Surface Plasmon Polaritons,SPPs),是一种由金属表面的自由电子与电磁场相互作用引起自由电子的集体振荡而形成的沿着金属表面(金属与电介质界面)传播的电子疏密波。SPPs具有突破传统光学中衍射极限的优势,同时还能极大地增强界面的电磁场。当SPPs的波矢与入射光波矢相匹配时,会发生表面等离激元共振(Surface Plasmon Resonance,SPR)现
学位
随着人们对视觉体验要求的日益提高,全息技术作为一种记录并再现物体三维信息的手段而备受关注。其最大的优势在于可以无损地记录并再现物光波的复振幅,使得物体得以以三维的形式再现在人们眼前。而数字全息更是可以通过数字化的手段,将全息图中记录的复振幅信息通过优化,重建三维模型,方便人们查看。然而现阶段数字全息在三维显示的应用上仍存在不少缺陷,尤其在无透镜傅里叶变换数字全息过程中,由于相位再现存在像差,目前依
学位
涡旋光作为一种携带轨道角动量(Orbital Angular Momentum,OAM)并且拥有相位奇点的特殊光场,在光通信,微粒操控等领域有着重要的应用价值。随着技术标准的不断提升,单一的涡旋光已经不能完全满足各种需求,故由多个涡旋光组成的复合涡旋光(Composite Optical Vortex,COV)应运而生。本文以设计共轴复合涡旋光生成装置为目标,提出并验证了一种能生成共轴复合涡旋光的
学位
电极材料对超级电容器影响巨大,制备优异的电极材料成为人们重点的研究工作。ZIFs材料具有比表面积大、孔隙率易于调节等优点,近些年里被证明是制备电极材料的最好利用的模板之一。本研究利用ZIF-67为模板,制备了两种镍钴基材料,并测试分析了它们的相关性能。具体研究内容如下:(1)探究材料作为正极材料时的性能。采用室温搅拌法制备钴基ZIF-67,多次实验找到了最佳药品量,以0.04 g的ZIF-67为模
学位
热电材料因其能够实现热能和电能的直接相互转化的特性,在能源和环境问题日益凸显的今天,越来越受到人们的关注。材料热电性能由其塞贝克系数、电导率和热导率三个参数共同决定。热导率又包括晶格热导率和电子热导率,除晶格热导率之外,其余几个参数之间相互耦合,难以进行单一的调节。因此在具有本征低晶格热导的材料体系中探索高热电性能成为热电研究的一个重要方向。作为(Bi2Se3)m(Bi2)n系列超晶格化合物中的一
学位
钙钛矿发光二极管因为制备方法简单、成本低、具有较高色纯度等优点,受到了越来越多的科研人员的关注。红光和绿光钙钛矿最高的外量子效率已经达到了20%以上,逐渐接近可以商用的水平。然而,蓝光钙钛矿材料效率较低、光谱稳定性也较差,限制了钙钛矿在全色显示及照明领域的应用。机器学习作为人工智能的一个分支,可以高效处理庞大的数据集,建立变量与结果之间的量化模型。为了高效开发蓝色准二维钙钛矿材料,本论文将机器学习
学位
机器嗅觉通过检测物质挥发性气味实现物质的快速检测鉴别。机器嗅觉技术快速发展得益于现代仿生学和人工智能技术为代表的数据与技术应用的深度融合。气体检测与识别技术已较为成熟,广泛应用于食品安全、生物医疗、化工检测等领域。嗅觉的智能感知作为近年来研究的一大新方向,与传统机器嗅觉对特定目标气味的检测分类不同,它从阵列式气体传感器响应信号中提取数据并处理,对气味进行描述性表征。气味的表征是通过借助象形词汇对气
学位
船舶使用气囊下水是我国首创的下水方式,其具有投资成本低、下水效率高且灵活方便等优势,目前已被广泛应用于各类造船厂。气囊在船舶下水准备过程中一直处于高压状态,一旦破裂会导致船底或螺旋桨等突出部件损坏,甚至造成人员伤亡,因此需要对气囊气压进行实时监测。传统的船舶下水施工过程采用人工巡检方式对气囊气压进行监测,存在读数易错、反馈滞后及人工成本高等一系列缺陷。为解决上述问题,本文建立了基于ZigBee的船
学位
钙钛矿量子点材料因其造价相对较低,可大规模生产等优势成为了新的研究热点,并且当钙钛矿材料被应用于发光器件时,还拥有着寿命长、色域广,以及亮度高等优点。在种类众多的钙钛矿材料中,铋基钙钛矿材料因其可用溶液法制备,环境友好、低毒性和较好的稳定性得到了大量的关注。铅基钙钛矿量子点已经开展广泛研究,可以达到较高的荧光量子产率,但是深蓝光效率仍然很低,而深蓝光铋基钙钛矿量子点有望在深蓝光发光方面具有很好的发
学位
视差精度和实时性能是评价立体匹配算法是否可靠和实用的两项重要指标。在先进驾驶辅助系统中,基于车载双摄像头采集的室外场景图像的成像质量容易受到行车道路环境的影响,在弱光或光影复杂环境下,双目视觉测距的准确度会降低。同时,安全可靠的辅助驾驶系统要求视差估计算法能够准确、快速地探测行车环境,并通过双摄像头采集的2D数据快速还原真实的3D场景。因此,保证双目视差估计的实时性和准确性,对于保障先进驾驶辅助系
学位