论文部分内容阅读
随着我国经济快速发展,居民收入水平不断提高,零售商品的种类极大丰富。虽然电子商务给居民消费带来了很大便利,但线下零售(如百货商场、超市、便民市场、便利店等)仍是我国居民最主要的消费场所。然而,在线下零售场景中,尤其在消费高峰时段、居民密度大的地区,经常存在结算效率低、人工成本高、结算体验差等问题。尽管自助扫码结算技术已广泛应用,但仍存在操作复杂、效率低下等问题。因此,设计和研发一种基于计算机视觉的批量商品自动识别与结算系统,具有重要的研究和应用价值。为解决上述问题,本文基于深度学习技术设计了一系列面向线下零售场景的商品检测与识别模块,并实现了一种批量商品自动识别与结算系统。该系统首先通过双目RGB摄像头拍摄放于置物台的多件商品,然后利用商品检测模块定位商品在图像中的位置,此后采用基于度量学习的细粒度商品识别模块构建商品特征库,最后通过特征检索与匹配识别商品类别并结算。本文的主要贡献如下:首先,为准确和快速地定位图像中的商品,设计了一种基于性能精度折中网络(PVANet)的商品检测模块。该模块采用了一种高效的网络结构,能够提高检测速度,同时保持检测精度。此外该模块引入了Inception模块学习有效商品特征,引入了串联整流线性单元(C.Re LU)结构提高检测的速度。通过在在真实场景采集的商品图像数据集进行模型训练和测试,该检测模块取得99.8%检测精确率和99.4%召回率,检测速度为14毫秒/图。其次,为了准确获取图像中商品的类别,设计了一种基于难度感知深度级联嵌入网络(HDC)的商品识别模块。该模块采用了一种级联的网络结构,能够加速网络训练速度,同时增强网络对难样本的学习能力。为提高网络识别性能,采用A-softmax损失函数训练网络。通过在真实场景采集的商品图像数据集进行模型训练和测试,该识别模型取得了99.52%平均召回率。最后,为了训练算法模型及测试系统的整体性能,本文在真实零售场景采集并标注了一个大规模商品数据集,包括500类商品,约十万张图片,标注了其中的商品包围盒和类别。最终系统整体性能达到98.21%的结算准确率,结算效率为0.5秒/交易。