【摘 要】
:
利用二维图像来对物体进行三维重建是计算机视觉领域的关键技术之一。相比于传统的三维重建往往需要对物体的形状或纹理分布进行预先假设,或使用立体几何匹配来完成工作,基于深度学习的方法在便携性与灵活性上有着独特的优势。最近一些基于深度学习的三维重建方法虽然取得了显著的进展,但在重建的结果的精度与细节方面仍有不足。针对上述问题,借助注意力机制与深度学习,构建了一个可以实现三维重建的深度学习网络结构。网络结构
论文部分内容阅读
利用二维图像来对物体进行三维重建是计算机视觉领域的关键技术之一。相比于传统的三维重建往往需要对物体的形状或纹理分布进行预先假设,或使用立体几何匹配来完成工作,基于深度学习的方法在便携性与灵活性上有着独特的优势。最近一些基于深度学习的三维重建方法虽然取得了显著的进展,但在重建的结果的精度与细节方面仍有不足。针对上述问题,借助注意力机制与深度学习,构建了一个可以实现三维重建的深度学习网络结构。网络结构整体分为特征提取网络,特征融合网络与模型生成网络。输入不同视角的物体图像,通过特征提取网络对其中的高维信息进行获取,然后使用特征融合网络对不同视角的信息进行融合,最后通过模型生成网络来输出重建的体素结果。其中为特征融合网络设计了两种方案,一种方案通过门控循环单元网络(Gated Recurrent Unit Network,GRU)与自注意力结合的形式来融合不同视角特征,另一种方案通过一个特征评分网络对不同视角特征进行评分,然后利用评分的结果加权融合视角特征。在常用的三维物体数据集ShapeNet上进行了模型的训练与测试,并同当下的基于深度学习的三维重建方法进行了对比,实验结果表明,前述的网络结构在多视角的情况下,取得了相较于时下流行的方法更高的重建精度。
其他文献
传统搜索引擎根据用户查询返回多个相关文档的链接已经不再能够很好满足用户的信息需求,用户更倾向于由信息系统直接为其问题提供一个可能的答案。近些年,基于神经网络的问答模型在多项测试中崭露头角,但是它们大部分都用于单跳问题,无法判断这些模型是真正理解了问题语义还是仅仅使用了简单的字面量匹配。相反的,多跳问题需要模型沿着多个中间实体推理才能得到答案,更具有一般性。通过研究开放域问答中多跳问题的推理机制,主
医学图像具有非常复杂的视觉特征,在传统医疗行业中人类医生凭借个人经验对图像中的病理类型进行分类,缺乏统一标准且不能保证分类准确率。神经网络在医学图像分类任务中可以发挥超越医生的分类性能,通过深度学习算法开发计算机辅助诊断系统是重要的研究和技术发展方向。多标签和不确定性标签是医学图像的两个自然属性。研究如何在含有不确定性标签的多标签数据集上进行数据挖掘是神经网络在医疗场景广泛、深度的应用中不可缺少的
股骨头坏死是一种各年龄段常见病症,一种新的股骨头表面置换外科手术可以更加有效地治疗该病症,为了保证手术的顺利进行,需要将手术器械顺着股骨干和股骨颈解剖轴的方向放置。因此股骨解剖轴的定位好坏将直接影响到手术的顺利进行与否。在分析了现有的股骨解剖轴定位方法以后,设计了一种基于随机抽样一致算法的股骨干和股骨颈解剖轴定位方案。在图像预处理模块,使用了重采样的方法统一像素间距。在股骨干解剖轴定位算法中,采用
随着医学影像技术在临床医学中的广泛应用,头颈CT图像骨骼分割在医学影像处理中发挥着越来越重要的作用。使用高效的头颈CT图像骨骼分割算法自动地对头颈部骨结构定位、分割,对于骨科医生的临床医学诊断、制定骨科手术方案或是血管分析中的去骨操作都有重要意义。基于传统的医学图像处理方法在自动化和分割精度上都不够理想,目前基于深度学习的CT图像骨骼分割方法被广泛应用,而且全卷积3D U-Net网络在医学图像分割
胸腹部是人体疾病的高发部位,胸腹部CT图像可被用于诊断胸腹部的骨骼类和血管类等疾病。设计一种自动分割方法将胸腹部CT图像中的多种骨骼分割出来具有重要意义,分割出的骨骼不仅可以直接用于CT骨分析项目,服务于骨骼三维阅片诊断、骨科手术规划等;而且可以用于CT血管分析项目中的去骨操作,满足血管显示和定位等需求。目前传统图像分割方法对胸腹部CT图像骨骼分割的精度不高,且很难将骨骼的类别进行细分。深度学习的
预训练语言模型适用于多种自然语言处理任务,也为自动文本摘要任务带来效果的提升。基于预训练语言模型Ro BERTa的简单抽取模型存在一些问题,因此使用四种改进方法来解决其存在的弊端以提升摘要质量。采用等级编码器机制解决文本截断的问题,等级编码器机制将Ro BERTa作为句子级抽取器,相同结构的Transformer编码器作为文档级编码器,保留更多文本信息的同时,提供更高层次的信息整合能力。采用基于图
非刚性目标三维重建作为三维重建领域的重要分支,其致力于求解非刚性目标的三维重建问题。相较于刚性目标的三维重建,其形变自由度更高、问题求解难度更大。而鉴于日常生活当中非刚性形变的广泛存在,求解此类三维重建问题是极具应用价值以及发展前景的。非刚性运动恢复结构(Non-Rigid Structure from Motion,NRSf M)是用于求解非刚性目标三维重建问题的一类经典方法,其通过序列图像中提
交通网络的快速扩张推动了物流配送行业的高速发展,研究容量约束弧路径规划问题可以提高配送效率和降低运行成本,从而进行科学的决策和精准的管理来迅速增加经济收益。弧路径规划问题可以应用到道路扫雪、洒水,以及信件投递等场景,还可以应用在无线通信领域的无线网络优化问题中。在现实场景下,受到早晚高峰、天气情况以及突发情况的影响,道路上的车辆行驶速度并不总是相同。由于路网状态的动态性,传统容量约束弧路径方法给出
全髋关节翻修术用于解决置换术之后出现的一些问题,手术非常复杂需谨慎操作。对翻修髋关节的解剖关键点的定位,能为后续的医生诊断提供参考,减少人工工作量。深度学习方法需要大量数据的支持,迁移学习则能在数据量不足的情况下获取定位效果好的模型。首先,对原始的翻修髋关节CT图像进行预处理,包括去金属伪影、统一图像的分辨率和像素间距、去金属伪影后处理以及归一化。其次,为了增加可用数据,对数据集进行了数据增强,包
当前,碳中和和发展绿色经济已成为全球共识,而应对气候变化、实现可持续发展需要大量投资,银行金融服务将在这一过程中发挥至关重要的作用。本文通过比较分析粤港澳大湾区内主要城市、银行机构在绿色金融方面的发展经验,总结存在问题,对银行机构如何进一步支持湾区绿色发展提出意见和建议。近年来,大湾区各市和银行机构在绿色金融发展环境、配套机制及产品服务创新方面取得较好成效,但仍面临境内外融通协作、产品体系、投资资