论文部分内容阅读
针对利用深度学习进行三维体素重建时网络结构通常较为复杂且训练过程需要大量标注的问题,提出了基于深度学习的三维体素重建改进方法。该方法在训练或测试时不需要任何图像注释或对象标签,且网络模型中去除了冗杂的残差模块。为进一步提升重建模型精度,网络首先利用标准的CNN结构对输入图像编码为低维特征,然后利用LSTM单元选择性的更新它们的单元状态或维持原状态,最后解码器解码LSTM单元的隐藏状态并完成3D概率体素重建。使用端到端的网络从大量的合成数据中学习目标物体图像到其3D形状的映射,通过训练编码器和解码器,