论文部分内容阅读
随着智能手机的广泛使用和4G、Wifi等高速网络的普及,图像正在成为人们信息交流的主要载体,如何借助计算机、手机等身边的工具提取图像上未知物品信息的需求变得越来越迫切。早期的物品识别方法需要根据不同的分类任务设计不同的特征提取算子,可扩展性较差,不能满足实际应用中对复杂环境下多种类物品识别的需求。随着大规模训练数据的产生和计算机硬件特别是GPU的发展,卷积神经网络这种深层次的机器学习方法能应对更加复杂的分类识别场景,且拥有更高的准确率。本文介绍了基于卷积神经网络的物品识别的研究意义与发展现状,并详细分析了物品识别和卷积神经网络的基本理论,结合应用开发技术,设计和实现了一种基于卷积神经网络的电脑端和Android手机端物品识别系统。 本研究主要内容包括:⑴阐述了常用的基于词袋模型、Fisher向量和局部特征聚合描述符算法结合SVM支持向量机进行图像分类识别的相关理论,并进行了物品识别的实验,对三种物品识别模型进行了对比分析。⑵提出了一种基于迁移学习的卷积神经网络物品识别模型,对已有的深度卷积神经网络结构作出修改,通过多个图像数据集上的对比实验,证明了本文算法相比于其它物品识别算法在准确性上有明显的优势;并简化了卷积神经网络模型,删减了部分卷积块从而减少模型参数,实验结果表明修改之后的模型在训练及测试中耗时更少,且对多个类别的图像识别准确率无下降。⑶采用服务端和客户端分离的架构,将结合迁移学习和进一步删减卷积块之后的简化卷积神经网络模型运用到物品识别系统服务端,设计和实现了包括PC端和手机端两个平台的一整套方案。利用跨域资源共享和内网映射技术解决了移动端和本地服务器间的相互通信问题,并在三个图像数据集上作了系统测试,实验结果表明,系统具有良好的在线识别能力,能帮助人们更加方便和高效地获取未知物品的信息。