【摘 要】
:
信息化时代,计算机视觉在实际生活中得到越来越广泛的应用。用摄像机和计算机代替人眼对物体进行识别、分类以及跟踪等成了新的研究热潮。图像处理和图像理解是计算机视觉的关键技术。图像语义分割是图像理解的基础,直接影响图像理解最终结果的优劣。传统的图像分割都是基于图像本身的特征进行提取,对象必须具体化,应用受到很大的限制。对于复杂的场景,传统的图像分割准确率和效率都达不到要求。基于全卷积神经网络(Full
论文部分内容阅读
信息化时代,计算机视觉在实际生活中得到越来越广泛的应用。用摄像机和计算机代替人眼对物体进行识别、分类以及跟踪等成了新的研究热潮。图像处理和图像理解是计算机视觉的关键技术。图像语义分割是图像理解的基础,直接影响图像理解最终结果的优劣。传统的图像分割都是基于图像本身的特征进行提取,对象必须具体化,应用受到很大的限制。对于复杂的场景,传统的图像分割准确率和效率都达不到要求。基于全卷积神经网络(Full Convolutional Neural Network,FCN)的图像语义分割能够直接输入任意尺寸的图片,省去繁琐的中间步骤,端对端实现像素级分割,提高分割的准确度。但是全卷积神经网络的语义分割存在特征分辨率低、上下文推断能力弱以及没有考虑前景和背景分布不平衡等问题。针对以上问题,本文以提高语义分割精度为目标,在FCN的基础上进行了改进,具体研究如下:(1)通过减小池化步长改善特征图分辨率低的问题,同时采用不增加参数数量和计算量的空洞卷积增大神经元节点的感受野,便于学习语义层次更高的特征;(2)采用多尺度池化和叠加高层语义信息的方式,强化像素与像素之间的关联,整合上下文信息,提高网络获取全局信息的能力;(3)采用改进的代价函数,调节权重分布,避免分类器发生偏向,解决样本类别不平衡的问题。在VOC 2012数据集上进行实验,并与其他算法的结果进行对比,实验表明本文提出的网络结构提高了语义分割的准确度,像素精度达到了89.9%,证明了本文改进算法的有效性。最后将该算法应用于道路场景识别应用,取得较好效果。
其他文献
设计了氢气定容燃烧模拟实验装置,利用纹影法在此装置中进行了无隔板和带隔板条件下的氢气空气预混合物燃烧特性研究。结果表明,该装置可模拟氢气、空气预混合物的自燃。本文
2019年是新中国成立70周年、“十三五”规划的冲刺年,也是决胜全面建成小康社会的关键一年。借此,江门国家高新技术开发区(以下简称江门高新区)加快完善系统完备、科学规范、
利用高速摄像的方法,在狭缝间距为2,mm的圆盘状微型定容燃烧装置中考察了常温常压、当量比φ为1.0~1.6静止丙烷/空气预混气中心点火后向外传播的火焰传播特性.结果表明:微型
在研究法拉第定律中,有许多能清楚地演示感应电流存在的实验.将一只动针式的安培计接在一线圈上是在这些实验中最常使用的装置,但在教室中使用并不很理想,因为它不能使许多的
近年来,民营企业极大地促进了我国市场经济的发展,但民营企业人员的渎职行为导致企业遭受重大损失的现象也日益增多。由于我国现行刑法对渎职罪主体仅限于‘‘国家机关工作人员
论述了发散思维及其在培养学生创造力方面的重要性,同时分析了目前学校教育在培养发散思维能力方面所存在的问题,并提出应用化学仿真教育软件来解决这一问题的设想,并以"探究
最近的研究显示,人们对食物味道的偏好能有效预测个体的社会认知,以及人格特质。如对辛辣食物的偏好,它不仅能预测个体的攻击人格特质,还涉及到个体的行为免疫功能。前人研究
本文采用《人体测量手册》的方法,测量了250例在成都地区收集的成人股骨扭转角和颈干角。其结果为:(1)我们采用的测量方法所测得股骨扭转角的数据均为正值。其平均值为21.48&
角色扮演是在某个场面中,由参加者扮演一定角色的戏剧表演形式。它的目的是通过表演者的语言、动作和观众的眼睛来了解某个场面,分析某个场面进而形成某种认识或观念。