论文部分内容阅读
图像语义分割在自动驾驶有十分重要的应用,可以让机器人在环境中分割出语义信息,从而对下游的控制动作做出决策。但大部分的深度学习模型都比较大,需庞大的计算资源,很难在移动设备中使用。为了解决这个问题,提出了一种用于语义分割的轻量级神经网络模型,采用编码-解码型与二分支型相结合的网络架构,利用分组卷积,深度可分离卷积,多尺度特征融合模块与通道混洗技术减少网络参数量、提升模型预测精度。本文模型训练结合Adam训练法与随机梯度下降法,使用的数据集为Cityscapes数据集,设置1000个训练周期。经测试,该模型参数量为3.5M,在单张显卡Nvidia GTX 1070Ti上的运算速度为每秒103帧图片,达到实时计算标准。在模型评估指标中,平均交并比为61.3%,像素准确率为93.4%,性能均比SegNet和ENet两种模型都好。