【摘 要】
:
现如今点云是无人驾驶、机器人系统、虚拟现实等多个领域广泛应用的数据源之一,而特征提取是点云处理与应用的必要环节。由此,点云的特征提取算法成为了计算机视觉领域的研究热点。随着深度卷积神经网络在二维计算机视觉中不断取得突破,许多研究人员开始考虑将其迁移到点云中使用。然而直接使用深度卷积网络处理点云数据存在一个问题:点云是无序的,即数据的完整表示与数据输入的顺序无关,而卷积网络适用于有序的数据结构。目前
论文部分内容阅读
现如今点云是无人驾驶、机器人系统、虚拟现实等多个领域广泛应用的数据源之一,而特征提取是点云处理与应用的必要环节。由此,点云的特征提取算法成为了计算机视觉领域的研究热点。随着深度卷积神经网络在二维计算机视觉中不断取得突破,许多研究人员开始考虑将其迁移到点云中使用。然而直接使用深度卷积网络处理点云数据存在一个问题:点云是无序的,即数据的完整表示与数据输入的顺序无关,而卷积网络适用于有序的数据结构。目前以点云为原始输入的深度卷积网络通过两种方式来解决这个问题:一类是采用对称函数,例如最大池化,使得不同输入顺序的同一点云经过处理后结果一致。第二类方法则是对点云进行某种顺序变换,将其变换为有顺序的点云。然而,现有方法在点云顺序变换方面的探索有所不足,限制了点云特征提取的效果。为了探究点云顺序序列对特征提取带来的影响,本文提出了一个基于自适应排序模块的端到端点云深度卷积网络。此网络可以对每一个输入的局部点云邻域都能自适应地学习一个独立的顺序变换,且在多类点云视觉任务中都有着出色的表现。本文也通过详尽的实验证明了基于自适应排序模块的点云深度卷积网络有效性和优越性。此外,自适应排序模块也可以灵活高效地嵌入其他主流点云特征提取网络中进一步提高其网络性能。本文的主要贡献有:1.提出了一种面向点云数据的自适应排序模块。该方法可针对输入点云进行顺序变换以实现顺序不变性,并可灵活嵌入主流网络以提升性能。2.构建了一种基于自适应排序方法的点云深度卷积网络,并在点云分类与点云分割任务上验证了其性能。3.验证了自适应排序模块的有效性,证明了点集顺序序列中潜在的几何信息在点云深度学习中起到关键作用。
其他文献
随着近年来人们生活方式改变,增强现实、机器人等高新技术的应用越来越广泛,物体姿态估计也变得越来越重要。由于物体姿态具有6个自由度(3个旋转量和3个偏移量),因此物体姿态估计也称物体6D姿态估计,该任务旨在估计物体在相机坐标系下的位置和方向。对物体6D姿态估计这一任务的深入研究,可以为场景理解,增强现实,机器人控制和导航有关的各种问题提出更有效的解决方案。同时近几年,视觉深度传感器的发展和深度数据的
数据是深度学习的关键,深度学习在图像分类问题上取得了重大的进展,一个重要的原因是拥有大量有标签的数据。CIFAR-10、CIFAR-100和ImageNet等有标签的开源图像分类数据集推动了深度学习在学术界的发展,但在实际工业场景中,有标签的数据仍是少数,大部分数据是无标签的。而数据标注一直是昂贵且费时的,在一些特定的领域,如医学图像分析,甚至要求标注者具有一定的专业知识。主动学习和半监督学习是两
自动式家具摆放方式生成任务在室内家装设计、虚拟现实、计算机视觉等需要数字化室内场景的领域中有广泛的应用场景。传统方法在预先定义家具的位置、功能、合理性等规则后,利用顺序迭代或能量优化的方式进行家具摆放。然而规则的定义以及优化迭代的过程会造成大量人力及时间的消耗。随着大规模室内场景数据集的出现,人们开始探究利用深度学习的方式进行家具摆放,因此需要能够在给定家具和房间结构条件下完成家具摆放任务的神经网
电子商务的蓬勃发展,带动了服装行业的快速发展,这也造成了互联网中服装商品数据(衣服图像、文本描述等)的爆炸式增长。为了有效解决互联网中服装数据过载的问题,帮助用户快速、准确地搜索理想的服装商品,基于图像的服装检索方法应运而生并被广泛应用在搜索引擎、在线购物等系统中。该方法允许用户简单地上传一张描述其需求的服装图像来检索满意的服装商品。然而在现实场景中,用户很难获取一张完全满足其需求的查询图像。用户
随着互联网技术的发展,用户娱乐需求旺盛,越来越多的在线视频网站兴起,如爱奇艺、腾讯视频等,其用户规模与视频资源在逐步扩大。相较于传统的电视节目,在线视频网站给予用户更多选择权,能够依据自身兴趣偏好选择视频观看。但是并非所有视频资源都是免费的,相当多的电视剧或电影资源需要用户付费成为会员之后才有权观看。为享受更多更优质的视频资源以及更良好的观看体验,越来越多的用户购买会员服务,但是用户是否购买会员往
近年来,随着互联网的发展和多媒体设备的普及,不同种类搜索引擎和社交媒体应运而生,人们越来越倾向于用不同模态的数据表示同一事物,人们对于进行模态间搜索的现实需求越来越大,跨模态检索方法研究成为人们急需面对的重要议题和热门研究课题。该方法旨在通过计算不同模态数据之间的相似度,为给定的某种模态的查询数据,检索出与其内容相关的其他模态的数据。由于低存储成本和快速的查询速度等优点,跨模态哈希检索方法能够有效
能源是人类社会赖以生存和发展最重要的物质基础之一,能源的开发和利用贯穿了人类社会的发展历程。然而,随着社会的发展,能源需求急剧增长,某些领域能源危机愈发频繁,能源短缺问题逐渐成为制约社会发展的关键因素之一。因此,“节能降耗”被世界各国提上了日程。在众多的能源类型中,电能在社会生产和日常生活中扮演了越来越重要的角色,因此电能节约是推进节能降耗工作的重中之重。与此同时,电能的广泛使用也带来了潜在的用电
青年就业是世界性难题,我国也不例外,以高校毕业生为主的青年就业压力将依然突出,青年就业难、失业率居高不下的问题引发社会高度关注,在这一形势下,以创业带动就业对缓解青年就业问题具有重要现实意义。各地团组织要牢牢把握住团的主要生命力即为青年,只有做好青年工作,特别是就当前针对青年就业创业而言,只有做好服务青年就业创业工作,才是彰显共青团群众性最重要的方面。较山东省其他县区而言,广饶县作为全国百强县,工
传统推荐系统通常根据用户的身份标识信息和用户在此网站长期的历史交互行为来构建用户的画像特征,以便充分挖掘该用户的兴趣,并向该用户进行个性化的推荐。这些方法通常只关注用户的长期静态偏好,将用户的历史交互序列分解为多个静态的用户-物品记录,忽略了用户偏好随时间的转移。此外,在某些场景中,用户的身份标识信息可能无法利用。例如,一些用户非常重视隐私问题,通常情况下会拒绝提供本人相关的身份标识信息,或者通过
在多媒体领域中,视频场所类别预测任务受到研究者们广泛的关注,例如个性化餐馆推荐、旅游路线规划、视频场所地点验证等工作。随着手机、平板等可携带设备的发展和推广,越来越多的用户使用这些设备拍摄视频来记录自己的生活,并分享到社交媒体平台。考虑到个人隐私保护问题,大部分人在分享时都不会提供地点信息和行程记录,这就阻碍了视频场所类别预测任务的开展和推进。现在,大部分视频场所类别预测工作都是利用多模态信息或者