【摘 要】
:
图像语义分割是计算机视觉领域的一个研究主题,它能够对给定图像的每个像素赋予预定义的类别,从而实现比图片分类、目标检测更精确的场景解析。这使得其在自动驾驶、增强现实和医学图像处理等领域得到广泛的应用。近年来,随着全卷积神经网络(FCN)的提出,基于深度卷积神经网络的语义分割研究取得了极大的进展。然而,分割精度的提高往往伴随着网络的规模、计算复杂度和运行延迟的增大。这限制着语义分割模型在实际工程中的应
论文部分内容阅读
图像语义分割是计算机视觉领域的一个研究主题,它能够对给定图像的每个像素赋予预定义的类别,从而实现比图片分类、目标检测更精确的场景解析。这使得其在自动驾驶、增强现实和医学图像处理等领域得到广泛的应用。近年来,随着全卷积神经网络(FCN)的提出,基于深度卷积神经网络的语义分割研究取得了极大的进展。然而,分割精度的提高往往伴随着网络的规模、计算复杂度和运行延迟的增大。这限制着语义分割模型在实际工程中的应用。本文面向车载场景下的图像语义分割方法展开研究。车载场景下的图像语义分割主要存在以下挑战。首先,车载场景下的目标具有尺度多样性,常规的标准卷积往往具有固定的感受野,导致不能很好地解决目标多尺度问题。其次,很难同时实现模型的高精度和高效率(参数量、浮点计算量等)。最后,车载场景下采集的数据是视频数据,单帧图像分割方法忽略了时序信息。本文针对上述问题展开研究,具体的研究内容如下:1)针对车载场景目标多尺度的问题,本文提出了一个级联膨胀卷积模块,用于在骨干网的各层中提取多尺度特征。同时,为了在骨干网的高层汇聚更多的上下文信息,基于级联膨胀卷积模块和通道注意力机制构建了上下文聚集模块。提出空间细节模块,该模块将网络低层带有丰富细节信息的特征传播到网络高层与语义信息融合,使得分割结果更精细。基于以上模块,本文构建了能实时运行的多层多尺度特征聚集网络。2)为了权衡模型的精度和效率,本文利用深度卷积和卷积分解设计策略减少网络参数量和计算量。具体地,本文对构建的多层多尺度特征聚集网络的各个模块中的卷积进行轻量化。通过大量的实验分析了轻量化技术对模型精度和效率影响。为不同的精度和速度要求下选择合适的网络模型提供了参考。3)本文基于TDNet(Temporally Distributed Networks)视频语义分割模型进行优化,利用视频帧的时序上下文信息来提高精度和减少计算量。通过分析TDNet的结构发现该模型存在着骨干网相对复杂和速度慢的问题。提出利用级联膨胀卷积模块替换骨干网高层的基本残差块并减少该模块的特征通道容量,将计算量至少减少了86%。同时,本文设计隔帧特征提取算法,该算法结合上一步的改进将速度至少提升了5.7倍。
其他文献
科学技术的飞速发展带来了知识经济时代,科技创新成为引领现代经济发展的第一动力,也是衡量一个国家综合实力的重要标志。在这一背景下,由大学直接参与创办的大学科技园应运而生,它把蕴藏在大学中的智力优势转换为产业优势与经济优势,成为社会创新动力的来源和支撑创新驱动发展的重要力量。中国的大学科技园经过三十余年的探索发展,规模日渐扩大,模式不断创新,取得了显著成绩,百余所大学科技园被认定为国家大学科技园。园区
建筑膜材作为一种轻质、透光、自洁的建筑材料,不仅在常规的围护结构中得到应用,也成为开合结构常用的建筑材料,其独特的力学性能也催生出了新兴的结构类型——膜结构。目前的膜结构中膜材与刚性构件之间缺乏良好的协同作用,通过膜材的展开与收纳实现结构的开合是最为轻便的一种开合方式,但也存在膜材出现褶皱而易损的问题。针对以上问题,本文提出一种新型气囊式膜结构,在增强膜材与刚性构件的协同作用的同时,其作为开合结构
传统制造业在智能化转型升级的过程中,面临着数据网络异构、设备计算能力不足等多方面的问题和挑战。制造模式呈现出的个性化定制生产趋势,导致制造企业需要在更短的时间内完成更频繁的制造任务调整,这对制造系统在产线规划调度层提出了快速重构的新需求。然而,传统的制造资源受限于自身硬件性能,导致复杂任务重构过程中需要大量的人工参与环节。本文针对这一不足之处,通过研究智能制造设备群体学习技术,提出了可行的解决方案
近年来,氮素污染物是造成水体污染和富营养化的主要原因之一,因此加强废水脱氮研究尤为重要。大量研究表明,光合细菌、硝化细菌、诺卡氏菌及芽孢杆菌等均对养殖水体中的氨氮具有较强的降解能力。本研究以广州市某养猪场废水为实验材料,旨在筛选出高氨氮降解优势菌株,对其进行菌种鉴定,研究其在模拟废水和养殖废水中的氨氮降解特性,为养殖废水氨氮降解提供优良的土著菌种。主要研究内容如下:(1)先后从养殖废水中筛选到两株
随着城市化进程的加快和人们生活水平的提高,我国污水处理能力快速提高,污泥产量同步大幅增加。污泥兼具污染属性和资源属性,如污泥含有大量的水,重金属及病原微生物,危害人类健康;同时污泥中含有丰富的有机质和氮、磷等营养元素,可从中回收资源。因此研究污泥的无害化处置及资源化处理,并打通资源化产品的出路,对我国污泥处理处置技术的发展具有重要的意义。本论文的研究内容如下:(1)以污泥含水率和腐植酸(HA)提取
热裂问题仍是激光选区熔化成形(SLM)制备Al-Zn-Mg-Cu系高强铝合金面临的主要障碍之一,成分优化及组织调控是解决热裂问题的主要途径。本文采用低能球磨法在Al-Zn-Mg-Cu合金粉末中添加亚微米ZrH2颗粒,通过SLM技术制备了无裂纹含锆Al-Zn-Mg-Cu合金,并在添加ZrH2的基础上再添加少量纳米Si以降低材料孔隙率,制备了无裂纹含锆和硅Al-Zn-Mg-Cu合金。在此基础上,优化了
我国的城镇及农村地区分布着大量的传统木结构民居,其有一共同的构造特点——木柱柱根浮搁于础石之上,即平摆浮搁式柱脚节点。针对这一柱脚节点,国内外学者开展了深入的研究,成果表明其具有良好的摩擦滑移与摇摆转动的耗能特性。但是,大量的震害调查资料表明,采用该种柱脚节点形式的木结构民居,常常在地震荷载作用下出现柱根超限滑移的破坏特征,严重时引起结构发生倒塌破坏。因此,对这一柱脚节点开展限位加固的研究就显得尤
随着摄像头制造技术的发展,嵌入式设备算力的提升和人们对于汽车主动安全的需求的不断提高,基于视觉的辅助泊车系统已经得到了越来越广泛的应用。目前,倒车影像系统已经得到较为广泛的普及,但二维全景系统和三维全景环视系统等目前仅在较为高端的车型上进行装配。对视觉泊车辅助系统进行研究,可以加速视觉泊车辅助的普及,消除驾驶员的视觉盲区,从而提高泊车的安全性。本文首先分析了各摄像头模型,研究了摄像头内外参数的标定
压室、冲头的热变形会引起压射机构配合间隙的变化,影响到机构的运动和金属液的流动,进而降低零件成形质量和设备使用寿命,如果对浇注温度、压室壁厚和初始间隙等结构与工艺参数进行合理优化将能有效改善这类问题。但是参数的不确定性普遍存在,对配合间隙的变化影响较大,造成压射工艺的波动。本文综合考虑结构与工艺参数的不确定性,提出压射机构和工艺参数的多目标稳健优化设计方法,进行系统的研究。基于热-力耦合模型进行了
P300 detection is a difficult task in the P300 speller-based brain-computer interface(BCI)system due to its low signal-to-noise ratio(SNR).Previously Convolutional Neural Networks(CNN)have shown promi