【摘 要】
:
视觉三维重建可以利用二维图像得到三维点云,还原物体的三维信息,这是许多三维应用中核心的一步。三维重建中,单目视觉法以其设备简单、成本低、使用灵活以及适用场景广泛等优点而深受学界与业界青睐。稀疏重建作为单目视觉法中基础的一步,是提升三维重建性能的方向之一。当前的稀疏重建中,都是单独用一种特征提取算法进行稀疏重建。因为每种特征提取算法所提取的特征有各自的优点,且目前没有任何一种特征提取算法能够很好地应
论文部分内容阅读
视觉三维重建可以利用二维图像得到三维点云,还原物体的三维信息,这是许多三维应用中核心的一步。三维重建中,单目视觉法以其设备简单、成本低、使用灵活以及适用场景广泛等优点而深受学界与业界青睐。稀疏重建作为单目视觉法中基础的一步,是提升三维重建性能的方向之一。当前的稀疏重建中,都是单独用一种特征提取算法进行稀疏重建。因为每种特征提取算法所提取的特征有各自的优点,且目前没有任何一种特征提取算法能够很好地应对所有图像类型,所以本文在稀疏重建的特征提取与特征匹配阶段,融合多种特征提取算法,以获得更好的稀疏重建效果,故提出融合Superpoint与Disk的稀疏重建。主要工作如下:1、选取Superpoint与Disk作为被融合的特征提取算法,并统一使用特征匹配算法SuperGlue。因为没有Disk对应的预训练SuperGlue模型,所以在开源数据集MegaDepth上训练Disk+SuperGlue中的SuperGlue模型,最终在验证集上得到≈0.6。2、在基于训练的特征提取算法重建中,使用Hierarchical-Localization集成特征提取与特征匹配算法,并使用Colmap完成后续重建,即基于Hierarchical-Localization+Colmap的框架,实现自训练特征提取与特征匹配算法的稀疏重建。在实现Superpoint与Disk融合时,以Superpoint为主,Disk为辅,实现图像之间的特征匹配结果采用1:1叠加。3、用已实现的特征提取算法进行单独重建与融合后重建,并分别在公开数据集Tower of London和作者实习某大厂自建数据集上测试。在Tower of London上测试结果表明,在点云信息上,融合后的重建算法比单独重建可恢复更多的三维信息,故融合的重建能提升稀疏重建结果质量。在某大厂自建数据集测试结果表明,融合的稀疏重建成功率为58%,优于用Superpoint单独重建的52%成功率与用Disk单独重建的48%成功率。
其他文献
大规模在线开放课程(MOOC,慕课)这一概念自2008年被提出,2012年开始在世界范围内兴起。慕课的诞生旨在为每一位学习者提供平等且高质量的学习资源,特别是在新冠疫情的大背景之下,慕课更是凭借其先天的优势成为了世界各国大力推广的教育方式。但是慕课由于缺乏强约束性,其高退课率以及低通过率也广为学界所关注。越来越多的研究者开始着手研究如何提升慕课的留存率以及通过率,其中,针对慕课平台学习者群体中那些
随着信息爆炸时代到来,越来越多的人难以在短时间内找到自己需要的资源。尤其是在蓬勃发展的科学研究领域,论文数量呈指数级增长,这给快速获取与自己研究领域密切相关的论文带了巨大的困难。通常,在研究生教育期间,为了更好的梳理自己研究方向的发展脉络,研究生要花费大量的时间和精力寻找论文。因此,个性化的论文推荐方法被研究生们所期待。近年来,随着社交网络的快速发展,基于社会关系规则和网络理论的推荐方法在一定程度
网络技术飞速发展的今天,数据成为创新和增长的重要驱动力,它可以帮助企业了解和改进业务流程,从而制定适当的发展战略,此类数据很多以某种固定结构存储在关系型数据库中,用户通常需要通过相关系统的交互界面完成数据检索,而自然语言作为人类最常使用的表达方式,具有简单、易用的优点。在此背景下,通过自然语言完成对结构化数据的检索,不仅为用户提供了一种新颖便捷的检索方式,还能提升数据的查询效率。自然语言理解NLU
在当前信息技术高速发展的情形下,各行业领域都产生了海量的数据,而这些数据往往都是存储在结构化或半结构化的数据库中。对于关系型数据库中数据的获取需要使用SQL语句来执行查询操作,但是这些编程语句的使用增加了非技术人员分析和使用数据的难度,开发技术人员也无法将所有可能用到的查询语句封装成接口供非技术人员使用。因此为了快速便捷地从数据库中准确获取数据信息,自然语言处理领域的研究人员尝试使用深度学习模型来
随着中国证券市场的快速发展,证券市场日益复杂,传统基于基本面分析的方法在股市中获利越来越困难。伴随着计算机的软硬件快速发展,基于数学和计算机的量化交易逐渐走进了人们的视野。量化选股和量化择时是量化交易两个比较重要的方向,量化选股有很多种实现方式,其中使用较多的是多因子选股,但是近年来的多因子选股论文都把因子与股票未来收益之间的关系看作是相同的,而现实中因子与不同类别股票未来收益的关系不一样。所以基
随着网络信息技术的发展,相比于传统的购物方式,人们更加热衷于网络购物,并且喜欢在京东、淘宝等购物网站上发表评论。同时,中文文本不再是在线评论情感表达的唯一载体。表情符号渐渐兴起并且快速演变,受到了广大网民的青睐。网络购物中,在线评论扮演着重要角色,对用户的购物决策产生重大的影响。因此,对在线评论进行情感分析,有利于商家掌握用户的真实评价,改善产品质量,给客户提供更加舒适的服务。关于在线评论的情感分
手势作为人类一种原始的交流方式,其特点是宜表达。无论是在人机交互还是在虚拟现实等领域都有着十分重要的研究价值。近年来随着深度学习的浪潮,各种基于深度学习的图像、视频处理技术的手势识别模型被提出,其中不乏一些在某些具体应用任务中效果显著的模型。相较于传统识别模式,深度学习方法可以自动且高效地提取图像特征,极大地提高了识别的准确率。然而,主流的识别算法为了达到更高的精度,往往有着极为深层的网络结构和极
近年来,科学技术水平飞快提升,越来越多的理论基础应用到实际生活中,而计算机视觉有着广阔的应用场景,例如自动驾驶,安防监控,智慧医疗等。目标跟踪作为计算机视觉中的一个热门研究领域,近年来也受到广泛关注。目前,目标跟踪已在工业生产、医疗、教育及交通管理等方面广泛应用。尽管如此,目标跟踪仍面临跟踪精度和跟踪速度的双重挑战。而孪生网络具有权重共享的特点,保证精度的同时降低了网络参数量。因此,孪生网络在目标
如今,伴随着互联网和智能终端的广泛应用,教学模式也随之发生了巨大的变化,在线教育受到了越来越多人的青睐。在网络学习的环境下,受到网速等因素的影响,学生无法保持老师当面授课那样的专注度。而课堂专注度是评估学习质量的重要指标,代表着学生对知识的接受程度和感兴趣程度。另外,在传统的教学模式下,教师可以时刻观察学生的课堂表现。但是在线教育由于空间的限制,教师无法及时获取到学生的学习情况。所以在线上授课的过
在人工智能技术不断发展的历史大背景下,中国的教育行业也逐步引入人工智能技术来辅助教学。对不熟悉的试题,进行针对性的重复练习是提升学习效果的重要手段。然而,家长往往难以获取试题的原始电子文档。通过图像处理工具对试卷笔迹进行手动擦除成为一种获取原始电子文档的手段,这种方法不仅浪费了大量的人力资源,对于不会操作图像处理工具的家长更是形成了阻碍。本文针对这种应用场景,提出一套试卷图片笔迹自动擦除的技术方案