论文部分内容阅读
实验室作为航天科研单位研发与生产的重要场所,是实现智能生产的载体。随着“工业4.0”、“互联网+”等与智能制造相关的概念被提出,智能实验室将是未来航天智能制造基础设施中的关键组成部分。本课题以人工智能已经成为国内外的未来发展趋势为背景,融合计算机视觉和机器学习技术,开发了一套智能实验室中的手势识别结构框架,提高了实验室的智能化水平,从而加快了实验室的研发和生产效率。手势识别可以看作是一种机器来理解人的身体语言的方式,而利用手势识别技术可以将传统人机交互中的通过键盘或者鼠标输入的交互方式拓展为通过摄像头远程识别手势进行交互,这无疑对推动人机交互的发展具有重大意义。因此,为了提高实际复杂场景的人机交互中动态手势识别的准确性和实时性,本课题提出了一种基于时序局部敏感直方图(Temporal Locality Sensitive Histograms of Oriented Gradients,TLSHOG)特征新方法的手势识别结构框架。该手势识别结构框架主要有两个部分组成:(1)采用深度学习物体识别模型SSD(Single Shot Multi Box Detector),对视频帧中出现的手势区域进行实时的精确检测;(2)采用TLSHOG特征新方法描述手势运动的时序变化和空间姿态,实现了快速而精确的动态手势识别。TLSHOG算法的主要步骤如下:首先,采用普通网络摄像头获取手部的二维图像序列作为训练样本,然后构造单帧图像特征描述手部的空间姿态,并结合时间金字塔(Temporal Pyramid,TP)来描述手势运动轨迹的时空特征,运用多维支持向量机(Support vector machine,SVM)算法进行模型训练,对测试样本中的多种手势进行精确的分类。本课题构建了新的手势识别结构框架,在包含24种手势的国际基准ASL Finger数据集获得识别精度0.903,不仅在与其他算法的精确度对比中名列前茅,并且处理速度达到了12fps以上,体现了本文算法的优越性。此外,为验证成果的实用性,实验采用本课题构建的手势识别识别结构框架对真实场景视频数据中的动态手势进行了识别,获得了0.893的识别精度和14fps以上的处理速度,无论是精确度还是实时性都满足了实际应用的要求。综上所述,可以得出以下结论:本文算法准确度高、实时性好、实用性强,对于复杂背景干扰、光照强度变化和手势姿态变化均有有较好的鲁棒性。