基于深度学习的语义分割与室内稠密点云地图研究

来源 :南京邮电大学 | 被引量 : 0次 | 上传用户:itliutao123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,机器人技术的不断进步促进了国内机器人行业的快速发展,如何使用机器人对周围的环境进行建模,并完成对场景的感知与理解是机器人智能化研究的重要课题。在对环境建模部分,实时定位与地图重建(Simultaneous Localization and Mapping,SLAM)技术实现了机器人可以知晓自身所处的位置和了解当前所在的场景,然而SLAM构建的稠密点云地图存在噪声点,并且缺失了语义的信息,使得机器人无法对地图进行感知与交互。在场景感知部分,可以通过神经网络去学习点云空间中物体的特征分布。Deep GCNs为图卷积神经网络中的一种,采用的深层图卷积可以完成三维点云语义分割任务,而其在预测模块部分存在一些不足,没有充分地利用局部特征之间的联系,且由于神经网络自身的限制,在语义分割结果中部分空间点被错误地预测。本文针对以上机器人在环境建模与场景感知部分的不足,提出了以下改进:(1)本文对于点云地图中出现的噪声点和缺少预分割信息的问题,采用基于密度的点云离群点去除以及超体素分割的算法。设计了一套基于四旋翼无人机的稠密点云建图系统,并在实际场景中完成了室内稠密点云建图,通过离群点检测算法一定程度上消除了地图中存在的噪声点,并采用超体素分割算法在点云地图中聚合各物体的局部特征,完成地图预分割。(2)本文对于Deep GCNs模型在预测部分未充分利用局部特征的问题,对原网络进行了改进,提出基于双通道注意力网络的Deep GCNs-Att语义分割模型,使用了公共数据集S3DIS对网络进行训练,与Deep GCNs相比,本文提出的模型具有更少的网络参数量与浮点运算数,采用6折交叉训练法在相同的主干网络层上平均交并比提升约2.16%,总体准确率为84.7%。(3)本文对于语义分割中出现误检测点的问题,提出基于曲率的马尔可夫随机场优化算法,首先通过两种不同的降采样算法过滤语义分割中冗余的信息,并采用马尔可夫随机场对语义分割结果进行优化,通过实验证明基于曲率的马尔可夫随机场优化算法的有效性,相比于Deep GCNs-Att语义分割结果,提升了约0.78%的平均交并比与0.36%的总体精度。本文设计了一套基于无人机的稠密点云建图系统,在实际的室内场景中进行稠密地图的构建,采用离群点去除与超体素分割算法对地图进行了预处理,提出Deep GCNs-Att语义分割模型与基于曲率的马尔科夫随机场优化算法,并在公共数据集S3DIS上验证了以上两种算法的有效性与可行性。
其他文献
电影作为视听艺术,声音与画面是主要的叙事媒介。在叙事过程中,根据影片要表达的主题、内容等的不同,有时以画面为叙事主体,有时又以声音为叙事主体,影视画面与声音相互作用,产生神奇的“声画反应”,共同完成叙事。其中,声音叙事有不可替代的作用和优势,甚至在没有画面的时候独自完成叙事。目前,在探讨影视叙事的论文中,探究视觉元素叙事手法的论文居多,对影视声音叙事的相关研究占少数。本文主要从影视叙事的角度出发,
随着人工智能和计算机视觉技术的快速发展,人体行为分析作为重要的研究方向,在诸多场景中得到了广泛的应用。其中,人体跌倒行为分析能够有效监测老人或者儿童跌倒事件,通过及时预警救助避免造成更大伤害,已经引起了业界广泛关注。本文立足于家居场景,对基于机器学习的人体跌倒行为分析技术进行研究,主要工作内容如下:(1)研究了人体跌倒行为分析相关算法。首先介绍了前景目标提取算法;然后研究了人体跌倒特征提取方法;最
研究旨在介绍饲料品质提升的生产管理经验及质量管理的关键点。针对决定饲料品质的新鲜度、清洁度、细粉度、均匀度、熟化度、酥软度、酸碱度和变异度等"八度"指标提出相应的管理思路和执行标准。通过对"八度"中各关键点的把控,可以有效提高管理效率,更好地提升产品品质。
纳西族是一个拥有璀璨文化的民族,其音乐文化独树一帜。倘若把纳西族的音乐比作是一棵树,民歌“谷气”就应该是这棵树的根茎。“谷气”历史悠久、寓意悠长,是纳西族地区流传最广、脍炙人口的民歌,更是纳西族音乐文化的源流和民间口述文学的重要载体。本文通过对纳西族族源追溯、民歌“谷气”的种类以及与其他民歌的对比等几个方面的内容,将民歌“谷气”的音乐风格特征进行了深入浅出的分析,并且利用田野调查收集来的一手资料,
随着人工智能的不断发展,智能批阅系统走进了人们的教学生活。深度学习图像处理技术在手写体字符识别中取得了突破性的进展,因此采用深度学习技术对学生的作业、试卷进行自动识别批阅具有重要的意义。本文研究的应用场景为小学生试卷。在试卷采集过程中,由于人工扫描的过程中可能不规范操作导致了图像倾斜和不清晰,进而影响手写字符识别。再者试卷文本字迹模糊,学生手写体答案与印刷体题目重合等情况也会影响手写字符识别。传统
多元文化教育的研究及实施已成为目前全球教育发展与改革的热点之一。多元文化教育旨在增进文化之间的相互了解、尊重彼此文化间的独特性和存在价值进而促进各民族文化的健康发展,实现各地区、各国家、各民族人民享有平等的受教育权和发展权。这一思想在促进全球文化的大发展大繁荣、加深各文化间的理解、解决新时代的全球性问题等方面发挥了推动作用。在此背景下,音乐教育领域也注意到了多元文化教育理念与音乐教育的内在联系。相
情感是人类在日常生活中随着意识产生的心理和生理状态。情感识别是实现人-机情感交互的基础和核心技术。随着深度学习相关技术的快速发展,情感识别已经成为计算机科学、认知科学等多门领域的研究热点。脑电信号作为大脑皮层的生理信号,能够直接体现人类的情感状态,与面部表情和行为姿势等人体外在信号相比,脑电信号具备不可欺骗性,因此基于脑电信号的情感识别研究具有实际意义。本文将脑电信号作为情感识别的依据,分别使用C
目前,多智能体系统的协同控制研究已经引起了交通控制、编队飞行、机器人传感器网络、自动网络导航等诸多领域科技工作者的兴趣。一般来说,多智能体系统的协同控制通过每个智能体与最近的邻居个体之间信息交互来达到共同目标。然而已经有多项研究表明,每个智能体不仅能够与邻居个体进行信息交互,还能够通过间接邻居进行多步信息交互。因此本文将对多步信息交互下的多智能体一致性进行深入的研究,并为网络谐振子系统和线性参数变
本论文以中国当代作曲家王西麟先生创作的交响组曲《云南音诗》第四乐章《火把节》为研究对象,以结构、配器、复调技术运用分析为辅,和声技法分析为主进行深入分析。以此对王西麟先生“中西结合”、“洋为中用”的创作形式与音乐思想进行解析,为自己今后写学位音乐作品的写作提供一些借鉴与启发。同时也为笔者今后进一步的学习、研究与创作打下良好基础,同时也望为同时代的年轻学子提供一些参考与借鉴。
在如今大数据环境下的读图时代,人们的阅读习惯和视觉经验正在发生着巨大改变,信息可视化成为主流阅读模式已经是必然趋势。相比枯燥的文字,信息图更具逻辑性、易读性和趣味性等优势,人们更愿意选择信息图作为获取信息的方式。对信息和数据进行整理和提炼,并以形象生动且有序的可视化展示,是阅读者迫切的需求。特别是在自然景观类景区中的科普信息传播,就更加需要在信息传播上做到简洁明了、清晰易懂且具有趣味性。面对现如今