论文部分内容阅读
随着人工智能的火热遍布全球,科技产业也开始转向智能化、数字化的方向发展,机器视觉是人工智能领域最前沿、最有价值的研究之一,而物体的识别与检测则是机器视觉领域的热点研究。本论文主要研究的是在双目视觉系统的基础上使用深度学习模型来进行物体识别和轨迹预测。在目标检测方面,不仅要在图像中找到目标的位置,还要对目标物体进行分类。这就需要目标检测与物体分类两种算法相互协作。本论文选用结合MobileNet的SSD深度学习神经网络进行目标检测,MobileNet作为轻量型的分类算法能够快速准确地提取目标物体的特征,SSD作为一步到位的目标检测算法能够高效准确地输出目标物体的位置,两者相结合大大提高了目标检测的准确率。在双目视觉方面,首先校准双目摄像机以获得双目摄像机的内部和外部参数,然后校正双目摄像机使其光轴彼此平行,再由半全局匹配算法对两个摄像机的图像进行特征匹配,可以得到两个摄像机图像的视差图,再由视差信息和标定结果进行三维重建,在运动期间获得目标对象的三维坐标。在轨迹预测方面,循环神经网络能过够有效地预测时序模型,但是由于长期依赖问题,循环神经网络的性能收到了极大的限制。为了解决这个问题并准确地预测物体下一个位置的三维坐标,利用长短时记忆(LSTM)进行位置预测,它特有的“遗忘”功能可以有效地规避长期依赖,并且比普通的循环神经网络有更好的表现。