【摘 要】
:
在计算机视觉中,一个很重要的分支是图像语义分割,它区别于图像分割和图像分类,它是将原始图像通过人为设定的语义,分割成若干不重合的有意义区域的过程。它是计算机视觉中一项极具挑战性的任务,也是实现场景理解的关键步骤之一。随着深度学习技术的不断发展和GPU计算能力的不断提升,传统图像语义分割方法逐渐被深度学习所取代。目前使用深度学习进行图像语义分割已成为国内外学者研究的一个热点方向。而在图像语义分割的应
论文部分内容阅读
在计算机视觉中,一个很重要的分支是图像语义分割,它区别于图像分割和图像分类,它是将原始图像通过人为设定的语义,分割成若干不重合的有意义区域的过程。它是计算机视觉中一项极具挑战性的任务,也是实现场景理解的关键步骤之一。随着深度学习技术的不断发展和GPU计算能力的不断提升,传统图像语义分割方法逐渐被深度学习所取代。目前使用深度学习进行图像语义分割已成为国内外学者研究的一个热点方向。而在图像语义分割的应用场景中,自动驾驶系统是其中一个极为重要的应用分支。对于一个完整的自动驾驶系统而言,可以准确实时的进行车外环境感知是绝对必要的,车外环境感知包括了各类不同的任务,其中尤其重要的就是图像语义分割。通过将感知设备传入的图像经过语义分割处理,得到各个对象的外部轮廓,从而控制系统可以根据在行驶方向上的分析出的多种类型的结构化数据发出正确及时的控制指令。由于自动驾驶和图像语义分割的高度契合性,所以本文的研究工作主要围绕基于深度学习神经网络的图像语义分割技术展开,平衡精度与速度,使其在满足自动驾驶需求的快速性的同时尽可能使每个类别的对象都能得到一个准确的分割轮廓。本文提出了一种基于Residual ESPNet的适用于自动驾驶场景的深度学习模型,在ESPNet的基本网络结构上优化特征提取模块并添加残差结构以融合底层语义信息,丰富特征维度;通过改变ESP模块中的卷积形式,减少计算量,使快速性和准确性达到一个比较好的平衡。同时提出了一种基于注意力机制和水平集的损失函数,水平集策略将对象分为外部和内部,构造了一个最小能量函数作为网络的损失,用来反向传播以最小化能量泛函,逐渐提高分割精度。在评价图像分割质量时,提出了一种新的基于轮廓的评价指标,该评价指标主要是基于BF Score和Jaccard Index的改进,在利用Jaccard Index的全局统计量的同时融入对象轮廓信息,使评价更为准确客观。
其他文献
受人类创造性解决问题过程——头脑风暴会议的启发,史玉回教授于2011年第二次群体智能国际会议提出了头脑风暴算法,算法通过聚类、替换和创新机制来尽可能地产生新的想法,从而逐代地对优化问题进行求解。随着时间的发展,对头脑风暴算法的研究也从单目标优化问题转向了多模态问题、多目标优化问题等,在很多领域所展现出来的优化性能都不亚于其他群体智能优化算法。但是,头脑风暴算法在超多目标优化问题上的相关研究并不多,
钢铁产品生产流程长、工艺复杂。其中,炼钢-连铸流程是钢铁生产全流程的关键环节,对钢铁产品的生产效率和质量起着决定性的作用。炼钢-连铸流程涉及众多工艺参数,包括在作业现场检测的工艺参数和生产过程控制参数。其中,生产过程控制参数是指导与控制炼钢-连铸流程的关键工艺参数。因为人工设定指导生产的关键工艺参数有效率低、易出错、参数质量因人而异等弊端。因此,本文基于工艺参数设定值的历史数据,基于机器学习的方法
会馆建筑是大运河苏州段沿岸独特的遗产类型。然而在苏州城市更新的过程中,大量会馆建筑遭到破坏,其生存状况十分严峻。本研究基于设计学的视角,主要运用文献研究、实地调研、归纳分析和案例分析法对大运河苏州段的会馆建筑进行研究。通过对会馆建筑的价值和保护利用现状进行深入挖掘和系统分析,归纳其保护利用工作中的现存问题。进而提出建筑与环境和价值共生、完善相关法律法规、增加会馆公共属性、引导公众参与保护、活化记忆
作为国民经济的支柱产业,钢铁企业的节能减排问题一直受到高度重视。而氧气系统作为钢铁企业能源系统中重要的一部分,其平衡调度问题一直是钢铁企业节能减排管理中的关键问题。本文对钢铁企业氧气的最大用户-转炉炼钢过程的氧气需求量预测问题以及氧气系统优化调度问题进行研究。主要工作是结合转炉炼钢吹炼计划和氧气需求量历史数据预测未来计划期内的氧气需求量,对制氧机组进行调度,达到氧气系统的供需平衡,减少氧气放散率,
钢铁表面缺陷是决定钢铁产品质量的重要因素,在钢铁生产过程中,产品质量检测是必不可少的阶段。钢铁表面缺陷的自动分类是钢铁产品质量智能分析系统中的关键环节,对钢铁企业的高质量发展至关重要。本文以某大型钢铁企业的钢铁产品表面缺陷图像为对象,结合机器学习和深度学习先进理论,对基于自步学习的钢铁表面缺陷图像分类方法进行了深入研究,实现了钢铁表面缺陷图像的自动分类,主要研究工作如下:(1)针对钢铁表面缺陷图像
目的 探讨全瘤及瘤周感兴趣体积(VOI)双区域T1 mapping定量参数结合钆塞酸二钠增强MRI对肝细胞癌微血管侵犯(MVI)的评估价值。方法对我院2019年1月~2022年9月术后病理诊断为单发性肝细胞癌的72例患者进行回顾性分析,并根据MVI表达状态分为MVI阳性组(n=23)、MVI阴性组(n=49)。术前行钆塞酸二钠增强MRI T1 mapping扫描,得到平扫(Pre)、肝胆期(HBP
脑瘤,即颅内肿瘤,是神经系统中常见的疾病之一。脑肿瘤分割技术在脑肿瘤的诊断和治疗的起着关键作用。目前,脑肿瘤分割以具有高组织分辨率的核共振成像(MRI)为研究对象,MRI脑肿瘤图像的空间分辨率差、对比度低和边界不清等复杂问题难以解决,从而降低脑肿瘤分割的准确率。同时,全卷积神经网络在医学图像语义分割展现出优异的性能,为脑肿瘤分割奠定基础。针对特征提取方式影响分割准确率的问题,引入了多尺度特征融合,
电动汽车作为物流领域应用越来越广泛的一种配送工具,具有节能环保、噪声小、使用方便、能源利用率高等优点。由于电动汽车续航里程有限,电量的补充时机和换电站的选择是规划配送路径时需要重点考虑的问题。需求可拆分思想作为传统车辆路径问题的一个重要分支,可以有效减少配送过程中使用的车辆数并降低行驶总路程,还能解决客户点货物需求量大于车辆最大容量的问题。因此本文研究了需求可拆分的电动汽车路径问题(electri
经济的快速发展和人们对物流需求的不断增长,使得人们与物流之间的关系变得越来越密切,也为物流行业带来机会的同时也带来了许多挑战。第四方物流作为物流运作的重要模式之一,其中的物流方与客户之间的匹配是一个重要的决策问题,对于提高配送质量和客户满意度有很大作用。本文在第四方物流背景下在现存的一对多稳定匹配方法基础上进行研究,从多个角度探讨了供需双方有限理性的稳定匹配,进行了以下三方面工作。(1)本文提出了
金属板带产品标签文字信息的检测与识别应金属制造工业运输作业的需求产生,用智能化方法代替人工方式不仅能够提高标签中信息记录的准确性,而且能够助力智慧物流的构建,具有重要的研究意义。本文就金属板带产品标签文字信息的检测与识别任务,深入研究了经典的直线检测、透视矫正、基于深度学习的语义分割、文本检测与识别等技术,提出了集矫正处理、文本检测、识别和纠错于一体的端到端金属板带产品标签文字识别解决方案,同时进