基于深度学习的三维点云混合数据增强策略研究

来源 :广东工业大学 | 被引量 : 0次 | 上传用户:guodianwangxg
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
三维点云分类近年来发展迅猛,在众多领域有着广泛的应用。神经网络被大量用于处理各种三维点云的数据问题,体现了深度学习方法解决三维点云数据分类和语义分割等问题具有非常高的优势。相比于二维图像数据集,三维点云数据集存在样本少、制作成本高和样本标记复杂等问题。同时,神经网络无法很好学习到点云特征,在对点云数据进行分类时未能取得理想的效果。基于深度学习的三维点云数据增强成为了目前的研究热点。本文的点云增强网络模型从基于点云数据的样本相似度和点云数据混合增强的方面进行研究,主要的内容和创新点如下:(1)针对高维的三维点云数据,本文设计了基于余弦相似度的点云自适应匹配算法和PCA点云数据降维匹配算法,可用于计算三维点云之间的相似程度。分别通过点云数据间的特征抽取方式生成向量和点云数据降维手段把高维的点云数据变成低维数据向量,再利用余弦相似度的计算方法计算向量之间余弦相似度。然后按照计算出相似度值的大小进行排序。最后根据排序好的相似度值选择相应点云进行进一步处理。这为后续的三维点云数据混合提供了非常清晰的思路。(2)针对制作三维点云数据费时费力的问题,本文设计了三维点云数据混合框架。受到二维图像数据增强的基于风险最小化混合网络的启发,在数据混合的方面,利用现有的三维点云数据进行混合生成新的点云数据样本。本文在数据的预处理阶段,根据输入网络的点云训练数据批次大小调整点云数据的混合批次大小,并根据随机生成的混合率为新数据赋予标签。通过修改损失函数使得网络能够根据混合率自动调整损失函数,在分类器和增强器的联合训练过程中进行反馈更新进一步提升了整体点云分类网络模型的分类精度。二维图像的数据混合方法加以改进后用在高维度的三维点云上是个非常有效的方法,利用有限的数据混合生成高质量的新样本数据,这使得点云分类网络在训练时能够有更多的训练样本学习点云特征,最后训练好的分类网络具有更好的分类精度,同时分类网络的鲁棒性和分类性得到了进一步提升。
其他文献
随着我国经济的飞速发展,人们生活质量的逐步提高,健康问题得到了广泛关注,同时促进关于健康的相关消费需求快速增长,因此,大健康行业应运而生成为一大新兴行业。2020年新冠肺炎疫情对人类的生活带来严重影响,大大强化了人们的生命健康意识,激发出的健康需求和大健康行业对接,使人们的意识不再只局限于疾病的治疗,而是把更多的关注放在疾病的防御上。大健康行业的体外诊断(IVD)产业通过定性或定量分析方法,对生物
学位
为确保集成电路(Integrated circuits,IC)的环境可抗力和性能可靠性,IC封装技术是IC制造过程中不可或缺的关键环节。然而,在IC制造过程中由于生产技术质量潜在某些不稳定因素可能会导致IC封装表面受到污染甚至是划伤等,这些缺陷将一定程度上侵蚀影响封装表面氧化层的保护作用,进一步影响IC功能参数的稳定性及可靠性。因此,IC封装的缺陷检测是IC制造过程中十分有价值和必不可少的任务。本
学位
我国人口老龄化日益严重,跌倒检测对保障老年人的生命健康具有重要作用。准确快速识别老人的跌倒行为,有助于及时提供救治。基于计算机视觉的跌倒检测是目前的研究热点,本文也是侧重于这方面的研究。首先使用人体姿态估计算法HRNet从视频中获取骨架数据;然后对骨架数据进行预处理;最后结合改进的时空图卷积网络和双向长短时记忆网络对骨架数据进行高维特征提取,实现跌倒行为分类和识别。主要研究内容包括:针对现有公开数
学位
近年来,由于生态环境恶化及生活饮食不规律等因素,肝脏疾病的发病率不断上升。对于出现明显病变区域的肝脏疾病,如肝脏肿瘤、肝内胆管结石、肝脏囊肿等,临床上往往需要采用手术切除的治疗方法。为了尽可能精确地切除肝脏的病变区域,避免因切入血管而导致大出血,医生需要按照Couinaud分段法,沿着周围的肝脏静脉实施切除手术。所以,在手术前需要对肝脏静脉血管进行定量分析和精确建模。在临床上,肝脏静脉血管往往需要
学位
随着时代的进步,我国的教育方法也在不断地改变,中小学课堂逐渐引入了“希沃白板5”,因其优越特点也被应用于各个学科,并且“希沃白板5”因其灵便性在一定的程度上使课堂质量得到了提升,同时“希沃白板5”具有的特殊性能为广大教师解决了众多的难题,而且还提升了课堂魅力。所以,“希沃白板5”逐步替代了传统的黑板和粉笔,成为一线课堂常用的一种教学手段,可以预见的是,在未来“希沃白板5”会持续被渗透于各科目的课堂
期刊
随着计算机技术和网络的快速发展,信息传播的主要载体已逐渐被视频取代,同时视频数据量也成为了网络大数据的主体。随着高清和超高清视频的出现,视频占用空间逐渐变大,为了高效地对数据量进行压缩存储和在互联网上快速传输,视频编码技术成为了关键。因此,视频编码联合组(Joint Collaborative Team on Video Coding,JCTVC)发布了新一代高效视频编码(High Efficie
学位
在脉冲神经网络模拟的研究领域,因当前的脉冲神经网络模拟器种类繁多,导致很多情况下模拟器之间很难进行模型迁移,使得模型无法跨平台验证,而PyNN作为至今已被广泛接受的SNN模拟器前端输入接口可以为提供统一的脉冲神经网络描述方式。由于每个模拟器在处理脉冲神经网络描述的方式、模拟器的网络拓扑、脉冲神经网络数据映射的方式不一致,多数新型模拟器很难直接使用PyNN作为其前端接口,所以一般会使用py Neur
学位
能源在离散型制造企业中扮演着重要的角色,制造设备的能源数据对于企业生产效率的提升,以及生产成本的管控有着重要的参考价值。基于云计算模式下的设备能源管理系统在离散型制造车间得到广泛地应用,但是车间制造设备的迅速增加和秒级采集数据的方式情况存在,使得能源数据量呈现出海量增长的趋势,在这种情况下,基于云计算模式下的设备能源数据直接上云的处理方式,造成了网络传输拥堵、数据池存储压力增大等问题。同时,离散型
学位
战术互联网是20世纪80年代诞生的新型军事通信网络,其通过将战场环境中的传感器、武器平台以及决策者进行网络化连接,提升了部队的整体作战效能。战术互联网的构建完全依赖于作战任务需求,在网络规划时需要以部队的战术建制为骨架,兼顾节点的网络职能与各指挥层级间的具体业务传输需求,确定场景内各子网的网络连通方式,最终确保战场内业务传输的有效性。近些年来,随着网络中心战(Network Centric War
学位
文字是人类文明的产物,蕴含着准确且丰富的高层语义信息,传达人类的思想和情感,是人们交流、信息传递和互动的主要方式之一。自然场景文字检测与识别任务,也可称为场景文字提取,其目标是从自然场景图像中获取文字信息,包括文字区域的定位以及文字内容的识别。由于场景文字检测与识别技术在实际应用中发挥着重要作用,例如实时翻译、自动驾驶、图像检索等,如何准确并且高效地从场景图像中提取文字信息一直以来都是研究的热点。
学位