论文部分内容阅读
深度学习作为人工智能的基础,应用领域十分广泛,尤其是卷积神经网络,在计算机视觉等领域取得了显著研究成果。为了适应现实生活场景,深度学习任务形式逐渐由单任务形式转变为多任务形式。有效的多任务深度学习模型,可以利用多个任务间的信息共通性和差异性来提高某个或某几个任务的性能,对其进行深入研究有助于促进各个领域的发展。随着电子商务市场日益壮大,商品越来越多样化,给平台、商家对商品进行快速准确的信息标注带来了巨大挑战,结合属性预测、类别分类等任务的多任务商品图像分类技术应运而生。有效的多任务商品图像分类模型,可以为商品图像类别标签标注、商品检索、商品智能推荐等服务提供技术支撑。本文以构建一个面向商品图像分类的多任务深度学习模型为目标,重点研究卷积网络特征迁移策略制定以及多任务参数共享机制改进两方面内容:(1)大部分卷积网络迁移学习研究中仅将预训练模型用作特征提取器,缺乏对预训练模型的精细化研究,针对这一不足,本文首先构建一个面向多任务商品图像分类的卷积网络特征迁移基础模型,将常用的VGG16、InceptionV3、.ResNet50三种预训练模型瓶颈层前网络及参数代入到基础模型中,整体考察三种预训练模型在本文商品图像数据集上的泛化能力;然后选择泛化能力较强的预训练模型,对其进行模块化划分,依次将各模块间的连接点作为迁移特征冻结与再训练的分割节点,研究当迁移特征冻结与再训练分割节点不同时对网络性能的影响。本文使用DCSA和DeepFashion商品图像数据集进行实验,实验结果显示,VGG16预训练模型在本文数据集上具有更好的泛化能力,另外,对于不同的数据集,预训练模型迁移特征冻结与再训练的最佳分割节点也可能不同。该部分研究成果可为卷积网络迁移学习中的迁移策略制定提供一些参考。(2)针对多任务深度学习中常用的软硬参数共享机制分支节点前对任务间特异性信息保留不足、分支节点后对任务间相关性信息交互不足的问题,本文设计了一个可以嵌入到多个同构网络中的局部共享单元,以期最大程度保留任务特异性信息和任务相关性信息。本文最终结合局部共享单元和卷积网络特征迁移策略构建一个多任务深度学习模型,并将其应用到商品图像分类中,使用DCSA及DeepFashion商品图像数据集对模型进行验证,并将学习结果与同构的硬参数共享多任务网络、软参数共享多任务网络的学习结果进行对比。最终经实验证明,本文构建的模型具有更优的分类准确率,表明与传统软硬参数共享机制相比,本文模型能够更充分地挖掘任务间的信息。