【摘 要】
:
场景的实时三维重建是一个非常热门的研究领域,其目的是使用消费级可见光相机对场景进行扫描,自动生成一个精确完整的三维模型,该算法在增强现实游戏、机器人室内导航、AR家具展示等领域都有广泛的应用前景。此外,该领域注重实时性,也就是在扫描的同时生成三维模型。现有的研究只能使用稀疏点云进行实时网格构建,生成的模型不能充分表现场景的精确三维信息,从而难以进行应用。因此,研究更高精度的实时三维重建算法非常有必
论文部分内容阅读
场景的实时三维重建是一个非常热门的研究领域,其目的是使用消费级可见光相机对场景进行扫描,自动生成一个精确完整的三维模型,该算法在增强现实游戏、机器人室内导航、AR家具展示等领域都有广泛的应用前景。此外,该领域注重实时性,也就是在扫描的同时生成三维模型。现有的研究只能使用稀疏点云进行实时网格构建,生成的模型不能充分表现场景的精确三维信息,从而难以进行应用。因此,研究更高精度的实时三维重建算法非常有必要。
算法基于ARCore增强现实开发工具,实现了移动端的实时三维重建,使用手机的可见光相机扫描物体或场景,由ARCore对图像序列进行跟踪并输出带位姿的关键帧,然后由增量式稠密重建算法生成场景的三维点云,然后采用双线程构网策略实时生成场景的三维模型。首先对PMVS算法进行优化,用半稠密匹配算法对种子点进行扩充,生成更多的种子点,然后进行种子点约束和排序。在点云扩散时,利用面片的邻域信息对法向初始值进行优化,从而使得生成的点云模型更加平滑。最后,为了降低点云扩散的时间复杂度,在不影响建模效果的前提下,利用多分辨率自适应扩散策略来进行算法加速,为实时三维重建提供效率保障。在上述优化的基础之上,实现增量式稠密重建算法,从特征点检测与匹配、点云增量扩散、点云过滤三个步骤分别提出优化策略,解决了因图像增多而带来的重建速度变慢的问题。最后提出使用双线程三角网格生成策略来生成三维模型,一个线程进行全局构网,来保证三维模型的完整性,另一个线程进行局部构网,保证生成三维模型的实时性。最后对原始网格进行简化,利用网格clean算法删除模型中的错误面片。
最后通过实验验证了实时三维重建算法的有效性,能够在移动端使用可见光相机实时地生成精度较高的场景三维模型。
其他文献
图在生活中扮演着至关重要的作用。在大数据时代,越来越多的应用将信息抽象成图数据,并使用图算法对图数据进行处理,例如社交网络图,路图,网络路由图等。由于现实信息随着时间逐渐变化,原始的静态图数据逐渐演变成了多版本图数据,图的规模也逐渐变大。如何对多个版本的大图中的大量数据进行存储和随机版本访问,成为了图处理中的新的问题。对多版本图数据的处理,现有的方法有的会导致海量的存储空间开销和高度的存储冗余。有
近年来,Unikernel在云计算领域成为新兴的研究热点。Unikernel是由LibraryOperatingSystem(LibOS)构建的,针对于特定应用的,单地址空间机器镜像。在Unikernel生成过程中,应用程序及其所依赖的组件被全部编译链接成一个整体并直接运行在Hypervisor之上,导致Unikernel在运行时无法修改其配置参数,无法进行在线功能更新。如果要进行配置参数和功能的
大数据时代的到来和互联网的蓬勃发展催生了大量的移动对象轨迹数据,基于这些轨迹数据的研究及应用在城市规划、用户行为分析、频繁模式挖掘等方面发挥着重要的作用,并对人们的生产及生活方式产生了极大的影响。然而,轨迹数据蕴含了移动用户在时空维度上的丰富信息,直接发布个人轨迹数据及位置统计信息会泄露用户的隐私信息。 现有的轨迹发布算法主要依托于批处理平台,而很少关注流场景下的实时隐私保护处理。轨迹流数据的高
最近的研究表明,基于深度神经网络模型的分类器的预测结果在特定环境并不具有鲁棒性,针对输入的微小改动往往会导致截然不同的输出预测结果。对抗样本正是人为设计的导致深度学习应用被欺骗甚至是失效的一种技术方法,以最大程度地增加目标网络的损失。人工智能领域的安全问题是不可忽视的一个重要方面,研究如何减轻以及防御对抗样本的攻击对人工智能未来的发展以及应用有着深远的影响。 目前,针对对抗样本的防御工作大都是通
足球比赛视频中的球员跟踪为足球赛事分析提供基础的数据支持,对智能体育视频系统的发展与应用具有重要意义。近年来,单目标跟踪领域出现的许多算法在各大数据集上取得不错的成绩,但截至目前,仍没有一种能够完美解决足球比赛视频中的球员跟踪问题的算法。 在深入分析足球比赛视频中球员目标特点的基础上,通过融合干扰项感知的颜色模型和目标感知的深度模型,提出并设计了一种球员感知的跟踪算法。颜色模型方面,提取目标球员
深度学习已在图像识别、自然语言处理等领域取得有效成果,但随着深度学习模型规模和输入数据规模的扩大,神经网络的训练过程对计算机的性能提出了更高的要求。COStream是一种数据流编程语言,在实现神经网络程序时能基于数据流模型提供的并行性,充分利用多核计算资源,减少训练时间。但现有COStream文法难以快速构建深度学习模型。 针对上述问题,对COStream的文法进行扩展,设计并实现了sequen
在以Kinect为代表的消费级深度相机进入市场后,基于深度相机的三维重建技术得到了快速发展并被广泛应用于游戏,设计,建筑等领域。但是,当前基于深度相机的三维重建技术仍然存在一些问题。在相机位姿计算方面,由于位姿计算依赖于传统图像特征提取,当场景纹理较弱或是重复纹理较多时,相机位姿计算不够准确,跟踪鲁棒性不足,直接影响到重建出的点云质量;在重定位和闭环检测方面,同样由于依赖场景纹理特征,导致重定位和
使用智能手机进行三维重建具有设备成本低、方便携带、易于获取实时反馈等优势,随着智能手机计算性能的不断提高,在智能手机上进行实时三维重建有了可行性。目前在智能手机上的实时三维重建算法普遍存在位姿估计不准确,算法效率低,建模质量不高,只能重建小场景等问题。 本文为解决上述问题,设计了基于智能手机的实时三维重建系统。系统由三个线程构成,分别是:建模线程,后端优化线程以及显示线程,建模线程负责彩色图像获
深度强化学习近年来在围棋算法、计算机游戏、机器人仿真控制等存在巨大状态空间的应用场景下取得了很大的突破,这得益于深度神经网络的函数逼近能力,也依赖于模拟器和计算资源,因为模拟器可以在计算资源足够的情况下快速并且近乎无限地生成智能体与环境交互的数据。但是在许多实际应用场景下,例如推荐系统、物流管理、能源系统优化、机器人实际控制中,数据采集是高成本且低频率的,从而导致数据稀缺。因此,若想使得(深度)强
颅内血管疾病是近几年来死亡率居高不下的严重疾病,给全世界患者带来严重的生命威胁。而非创伤性血管成像技术(CT angiography,CTA)能够显示大脑各大动脉细节,能够辅助医生早期发现患者颅内血管的隐藏病变。该技术不仅对患者安全高效,而且是辅助颅内血管疾病诊断的常用技术之一。而在医生分析CTA影像的大脑血管病变状况过程中,首先需要去除CTA影像中的颅骨部分,再进行血管的三维重建成像。但在目前提