【摘 要】
:
工厂物品本身种类繁多、材质不同、颜色多样以及和背景之间存在的空间位置关系,自动分拣任务复杂。工厂物品自动分拣装置主要包括视觉算法部分和动力学装置,本论文主要研究视觉算法部分。随着深度学习和计算机视觉技术的飞速发展,国内外企业、高校已经非常重视以机器视觉为基础的自动分拣技术,并且在工厂生产中得到了极大的应用。深度学习能有力的进行特征选择和表征,为计算机视觉、机器人、金融和医疗等方面带来了新的发展机遇
论文部分内容阅读
工厂物品本身种类繁多、材质不同、颜色多样以及和背景之间存在的空间位置关系,自动分拣任务复杂。工厂物品自动分拣装置主要包括视觉算法部分和动力学装置,本论文主要研究视觉算法部分。随着深度学习和计算机视觉技术的飞速发展,国内外企业、高校已经非常重视以机器视觉为基础的自动分拣技术,并且在工厂生产中得到了极大的应用。深度学习能有力的进行特征选择和表征,为计算机视觉、机器人、金融和医疗等方面带来了新的发展机遇。将深度学习应用到工厂自动化生产领域已成为人们相同的共识和挑战,也为其工作速度加快带来了新的动力。本文的主要研究内容如下:首先,介绍了深度学习的发展历史和特点,其通过构建深层模型和大量数据学习更有用的特征进而得到很高的分类或预测的准确性。重点阐述了卷积神经网络的发展、结构和性质,以及其在语义分割和二维和三维信息融合方面的应用。针对工厂物品自动分拣的问题,本文详细分析了主流语义分割网络和基于生成对抗网络的语义分割网络的优劣势,并最终以循环生成对抗网络为基础,设计了针对工厂物品的语义分割网络。针对数据信息提取,使用了成对数据以提高更多的语义分割信息,同时增加了特征提取网络增强网络的特征提取和学习能力,最后优化了网络的损失函数,使得网络最终的语义分割能力达到了当前最好的水平。然后设计了端到端的二维和三维信息融合算法,首先使用设计的二维语义分割算法提取二维信息,然后使用深度网络提取三维点云特征,并将二维和三维特征嵌入和融合,网络最终输出物品的位置空间信息。最后,对本文设计的针对工厂物品的语义分割算法和二维和三维信息融合算法进行实验检验。网络在测试集上表现均达到了当前较高水平,满足设计预期,本文设计的网络具有一定的现实意义。
其他文献
“文化是一个国家、一个民族的灵魂,文化自信是国家和民族发展中更基本、更深沉、更持久的力量。没有高度的文化自信,没有文化的繁荣兴盛,就没有中华民族伟大复兴”。党的十
中日文化的联系与交流自古以来就有着非常悠久的历史。甲午战争战败后,清政府更加重视对外来文化的汲取。此时,正值日本明治维新改革成功之际,于是,清廷将学习日本视作救亡图
数学作为推动科学技术进步的关键力量,数学素养成为现代公民的必备素养。中学阶段是学生智力发展的重要时期,也是培养数学素养的关键阶段,通过对拉萨藏族学生数学素养的现状
古往今来,“政策”一词从未离开过人们的视野与生活,在不同时代背景下均发挥着举足轻重的作用。毋庸讳言,农村体育作为时代背景下的产物,其健康、快速发展,必然离不开政策的
随着我国科技的迅猛发展,各类新型的气象观测设备层出不穷,为气象观测业务提供了新方法、新技术、新思路。为了确保各类气象观测设备在进入气象业务系统运行时可以满足气象业
西部史研究是美国史研究的重要领域,特纳“边疆假说”的发表是被看作美国西部史研究开创的标志。二十世纪三、四十年代,美国史学家对特纳“边疆假说”中边疆的模糊概念、民主
随着移动通信的快速发展,用户对室内位置信息的实时性和准确性的要求越来越高。而基于WiFi指纹的室内定位被公认为是室内定位领域最具前景的技术之一,这种技术的优势很明显,低成本高可靠性。但潜在的隐私问题也不容忽视,离线采样阶段存在暴露数据提供者位置信息的风险,客户端的位置信息和服务器数据库的数据信息也可能在在线定位阶段泄漏。针对WiFi指纹室内定位系统中的隐私泄漏问题,本文的主要贡献如下:(1)对于在
随着信息时代的进步,图像处理技术普遍应用于军事、医疗、交通等诸多领域,与日常生活密不可分。然而在采集、传输图像等过程中,由于设备老化、外界环境的干扰等不可避免的原
随着移动计算设备、多媒体业务等通信业务的迅猛发展,近几年人们对宽带微波传输技术的需求日益增加,在宽带微波通信系统中频谱拥挤的问题越来越突出,始终面临着频谱资源短缺这一严重问题。为了解决宽带微波通信信道拥挤的问题,除开发新的频段外,频率复用也是一种行之有效的技术,科研工作者对频率复用进行了大量的研究,双极化传输技术就是一种重要的频率复用技术。采用双极化复用技术能使传输速率和信道容量加倍,支持更高数据
随着互联网技术的普及,人们在使用智能设备的过程使用的文本数据越来越多,如何更快速、更高效地从海量文本中获取我们所关注的信息,是文本挖掘技术关注的热点。文本聚类作为文本挖掘的重要技术,能够帮助用户更有效地获取文本中的有益信息。作为自然语言处理的基本技术之一,文本聚类技术的难点主要有以下三点:第一,聚类效果与人类观感的匹配;第二,聚类结果的可解释性程度;第三,如何让计算机从自然语言文本中获取高级语义信