基于彩色-深度图像信息的室内场景语义分割研究

来源 :武汉科技大学 | 被引量 : 0次 | 上传用户:dragonlumeng
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图像语义分割一直是计算机视觉领域的研究热点,其目的是通过分割不同物体,赋予物体不同语义类别标签,使计算机全面地获取场景语义信息。但目前研究主要聚焦在使用彩色图像数据作为训练,针对室外场景且单一任务的语义分割。而在实际应用中,室内场景比室外更加复杂,机器人除了需要知道物体的语义类别信息之外,还需要知道物体的位置信息以便完成更为复杂的视觉任务,同时室内场景光照等因素会对彩色图像产生影响。针对以上问题,本文以复杂室内场景为研究对象,利用RGB-D图像信息,基于深度学习、卷积神经网络算法为研究基础,开展联合目标检测的多任务语义分割研究,主要研究工作如下:(1)基于Kinect室内场景数据库的建立。通过Kinect的相关内置参数矩阵,确定相机彩色摄像头与深度摄像头的位置关系,保证相机采集的彩色与深度图像一一对应。利用Kinect获得室内场景的彩色图像和深度图像,构建室内场景图像数据库。(2)基于卷积神经网络的RGB图像室内场景语义分割。构建基于改进的FCN语义分割模型,采用迁移学习的思想对模型进行训练,引入深度优化算法,提升网络的训练速度和收敛速度,建立室内场景下基于彩色图像的训练模型,语义分割预测实验验证了算法的有效性。(3)基于RGB-D图像的室内场景多任务语义分割。基于改进的Faster-RCNN算法构建联合目标检测的多任务语义分割模型,使其同时实现语义分割、目标分类和检测多项视觉任务。同时通过对彩色和深度图像进行融合、引入RoIAlign、改进NMS算法等系列操作来提高模型的性能。针对室内场景语义分割问题,使用彩色、深度、融合图像数据分别对模型进行训练,通过多次实验对比,验证了本文多任务语义分割模型的可行性和准确性,使用RGB-D融合图像训练得到的精确度比分别使用彩色、深度图像提高了2.650%、17.675%。
其他文献
写作是英语教学中不可或缺的一部分,也是最困难的教学任务之一。教师纠错反馈是影响教学效果的重要因素之一,但是国内关于教师纠错反馈的研究还相对较少。本论文基于相关文献
随着科学技术的发展,人们越来越关注温室气体给人类带来的影响.各国的学者们纷纷行动起来,提出各种措施来消除温室气体带来的消极影响,碳交易价格市场机制就是其中措施之一.
人脸识别正逐渐地应用于现实生活和国防安全领域,但是还存在着很多问题有待进一步解决,如遮挡、光照变化、表情变化、少样本等。本文着重从光照变化出发,围绕光照不变特征提
在自然界中,广泛存在着两种视觉系统,一种是类似于人眼的单眼视觉系统;另一种是复眼视觉系统,其本身具有很多优势,如大视场观测、时间分辨率高、结构紧凑、可利用偏振光进行
输变电绝缘子作为电力设施的重要组成部分,其爬电距离(简称爬距)是评估其绝缘状态的重要参数。接触式测量方法已无法满足在运检测的需求。论文通过对绝缘子的形貌特性与光学
不良资产处置工作是促进国家经济稳定、增强经济发展信心的重要切入点,不仅可以有效缓冲金融风险,还能避免金融危机爆发对宏观经济环境产生不利影响。资产管理公司通过债务重
甲苯氧化是一个非常重要的化学反应。其氧化产物苯甲酸、苯甲醛、苯甲醇、苯甲酸苄酯被广泛地应用于医药、食品、香料、树脂、纤维等工业,目前生产工艺主要是采用甲苯液相催
随着网络共享图像数据的日益丰富,从图像中检索和定位出同类对象的需求变得更为迫切。即给定一组包含同类对象的图片集合,要求在各幅图片中确定该类对象的位置和大小。如果使
本课题使用薄膜分散-超声-膜挤出法制备盐酸胺碘酮(ADHC)脂质体,通过响应面设计法优化ADHC脂质体的处方和制备工艺,并对优化后的ADHC脂质体进行体内外释药行为的考察;通过建
化学发光法和电化学的巧妙结合带来许多潜在的优势。首先,电化学发光不需要使用外部光源,同时一些反应物可以在电极表面再生,从而允许过量的共反应物存在,这大大提高了电化学