论文部分内容阅读
在一些危险区域,比如重核辐射区,人类无法在现场工作,引入遥操作技术是该问题比较好的解决方案。在操作控制端,遥操作者带着VR眼镜,远程控制危险区域的设备,进行远程工作。对于一些精细的任务,比如抓取一些复杂物体,这需要操作者清晰看到对物体的3D物理结构,而且为了更加准确对其操作,还需要知道该物体的姿态。但是有时候物体被遮挡,仅仅依靠眼睛很难判断物体的姿态。为了解决上术问题,需要解决3D图像远程传输、3D点云远程呈现、物体姿态估计等问题。因此,本文设计3D图像预处理算法、3D图像远程传输框架、物体3D远程呈现框架、物体姿态估计算法,运用于远程呈现。首先,在远端通过立体相机采集3D点云数据,由于相机存在误差与畸变问题,因此,需要对3D点云数据进行预处理,本文设计了3D点云滤波器和3D点云分割算法,对3D点云数据进行预处理。为了加速后面处理操作,对点云进行体素化。实验表明,3D点云滤波器和3D点云分割算法可以有效去除异常点,让3D点云更加平滑,提升后面的处理算法的效果。接着,为了让遥操作者可以实时进行远程工作,本文设计3D点云压缩算法,先对点云压缩后再进行网络传输,在操作端再进行解压。本文设计了两种压缩框架,一种是基于全局聚类的压缩框架,另一种是基于八叉树的局部3D点云压缩框架。在第一个方法中,首先,为了进一步消除三维点云数据的冗余,采用运动估计的方法获取点云之间的时间相关性。SHOT(signatures of histograms orientation)描述符用于匹配两帧之间的点,以计算运动矢量。为了减少计算时间,在匹配操作之前,利用八叉树结构对每个帧进行体素化。然后,将预测帧(Pframe)的保留信息和运动矢量发送到远端,并且利用帧内帧(Iframe)的信息、P帧的保留信息和运动矢量来预测新帧。实验结果表明,该方法具有计算量小、压缩比低等优点。第二个方法的关键是通过寻找两帧点云数据之间的时间相关性来减少时间冗余。首先,宏块将由点云数据体素化生成。然后,将两帧点云数据对齐,根据预测帧(P帧)和帧内(I帧)的点个数和颜色方差,初步判断预测帧(P帧)和帧内(I帧)之间对应的宏块是否一致。最后,利用ICP算法进一步匹配两个宏块,当ICP算法的结果低于阈值时,由I帧中相应的宏块预测P帧中的宏块。在本文的方法中,宏块的大小是可变的。实验结果表明,该方法不仅可以减小图像的延时,提高压缩比,而且视觉效果更加平滑,失真率更低。然后,对物体姿态进行估计,方便操作者进行任务操作。本文提出了一个名为Pose Point RCNN的网络框架来估计物体的6D姿态。原始三维点云的坐标和RGB颜色信息作为网络的输入。姿态估计分为两个阶段。在第一阶段中,生成目标的三维提议和姿态,为第二阶段的优化计算提供粗略的姿态估计。为了获得更高的召回率和准确率,还采用了注意机制和引入掩模分支。将目标随机放置在不同场景中,对TUW目标实例识别数据集进行增强,并设计了一种新的方法生成训练网络的样本标签。实验结果表明,该方法能正确估计目标的姿态。通过加入注意机制和掩码分支,该网络的召回率提升到53.24,而没有注意机制和掩码分支的召回率仅仅为16.72。最后,在操作控制端,使用Unity引擎将解压好的点云和物体姿态进行渲染,操作者通过VR眼镜可以观看远程3D场景。实验证明,操作者可以清晰看到远程3D场景并成功进行了远程操控设备来进行工作。本文研究并设计了3D点云数据预处理算法、两种实时3D点云压缩算法、基于3D点云的物体姿态估计算法和点云在Unity引擎中渲染技术,为实时远程呈现技术提供了技术支撑。