论文部分内容阅读
视觉是机器人智能的基石,而图像识别是视觉的基础。SIFT+SVM、HOG+SVM等算法应用于机器人图像识别领域,由于其算法的局限性,识别率常年难以突破。随着人工智能的发展,深度学习愈演愈烈,尤其是卷积神经网络在计算机图像领域取得了很大的突破,因此,将深度神经网络和机器人分拣任务的实际情况融为一体更具有实用性,通过深度学习来提高机器人分拣的智能性。论文对传统图像识别算法的缺陷进行了分析,报告了深度学习的国内外研究现状,确定利用卷积神经网络来提高机器人识别分拣的效率。介绍了深度神经网络的基础知识,详细的分析了卷积神经网络的网络结构,并且推导了卷积神经网络的前向、后向传播的算法,为图像识别模型建立提供了理论基础。在机器人分拣识别中,有很多任务是对同一物体的质量进行识别的。为了满足这一实际情况,论文创建了苹果数据集。该数据集中含有3926张图片,这些图片是根据实际的识别任务进行现场拍摄的。相比通用的MNIST、CIFAR-10数据集而言,更具有实际意义。论文针对机器人对同一物体质量识别效率低下的问题,设计了一种基于深度神经网络的苹果质量识别模型,该网络模型是由输入层、6层卷积层、2层全连接层和输出层组成;为了获得更好、更具体的图像特征,在设计第三卷积层时,引入了Hebbian原理,这能够将前两层学习到关联性非常高的、而且又不在同一个通道的高阶特征相连接。论文还阐述了其他层的设计理念,并且计算了每一层需要训练的参数。利用Python语言设计了图像预处理的代码;根据网络识别模型的计算参数,在TensorFlow深度学习框架上搭建了苹果质量识别模型;为了避免梯度弥散,采用了能够进行单侧抑制的Relu激活函数;为了加快代价函数的收敛速度,利用随机梯度下降法进行网络训练。通过训练,得出了关于一些重要参数对性能影响的规律。最后将训练好的模型进行测试,实验结果表明,该模型可以非常有效的进行同一物体质量的识别。相对于传统识别算法而言,该识别模型对苹果质量识别的正确率达到了95%以上,识别时间也大大的缩短了。