论文部分内容阅读
本论文充分运用深度学习相关技术和理论知识,研究了致密链接、卷积以及循环网络等等神经网络各自的工作原理和优势,归纳了3D-R2N2循环神经网络存在的不足和缺陷,并在此基础上提出并实现了一系列针对3D-R2N2网络中Encoder、损失函数以及Decoder模块的改进方案。经过本文改进后得到的模型与3D-R2N2原模型相比,不论是在网络执行任务的速度还是空间占用率以及重构精确度等方面都得到了比较明显的提升,本文所做的具体工作如下:1.本文提出并实现对3D-R2N2网络中Encoder模块的改进。本论文将原来3D-R2N2中采用的线性链接的卷积网络层,改为使用致密链接形式的卷积层。相对于旧的模型,新的模型训练更加迅速、稳定,损失函数收敛速度更快,同时重构的三维模型也更加精确。2.本文提出并实现了对3D-R2N2网络中损失函数的改进。本文将原来网络的交叉熵代价函数,替换为了以Chamer距离(DT)为基础进行损失值计算的新型损失函数。使用了新的损失函数使得原来的模型,训练速度更快,损失值能够收敛到更小,同时具有更好的重构精度。3.本文对3D-R2N2的Decoder模块进行了改进。本文论在3D-R2N2网络的Decoder模块中新增了一条分支网络,该分支网络能够对图片信息中的色彩进行提取和分析,并能够根据图片提供的色彩信息,为重构出的三维模型进行上色。经过着色处理后的三维模型结构更加清晰,更利于用户对重构出的模型进行观察和评估。最后,本论文将改进后的网络模型用在ShapeNet以及PSCAL 3D数据库上行进行了实验,同时参与实验对比的还有原3D-R2N2网络,以及另外两种同样采用深度学习技术实现三维重构的网络模型,在整个实验过程中,本文使用了信息可视化工具对实验中的各项数据进行了分析和总结。实验结果表明,经过本文改进后的3D-R2N2网络无论是时间性能,还是重构的精度都要领先于其他参与对比的网络。