基于SIFT算法的手势控制系统的设计与实现

来源 :现代经济信息 | 被引量 : 0次 | 上传用户:chjj1988mm
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘要:为了增强人机交互的人性化和多样化,设计了一种基于SIFT算法的手势实时控制系统。本系统只需普通PC机与摄像头就能对手势进行准确的识别。并且还可以进一步对采集到的图像进行选择,这一选择主要是依据肤色检测得来的,另外我们还可以采用SIFT算法找到与待测图像相应的图像,充分发挥手势识别技术的优势,利用输出信息完成实践应用的控制工作。该系统不需要建立大容量的样本库,运行速度较快,对手势的识别具有较高的准确性。
  关键词:手势识别;SIFT算法;肤色检测;特征点
  中图分类号:TP391.4 文献识别码:A 文章编号:1001-828X(2016)015-000-01
  引言
  伴随着全球信息技术的飞跃式发展,人们对计算机的使用提出了更高的要求,手势交互方式具有较多的推广优势,如生动形象、具体等,因此手势交互方法被普遍应用在人机交互工作中。
  一般情况下,手势控制系统可以被分为两大类,主要依据就是输入设备的差异,第一类是针对数据手套的手势控制体系,第二类是针对视觉的徒手手势控制体系。后者的控制体系通常需要较大容量的样本库为后续工作奠定基础,还应该确切的描绘出不同手势的具体范围,对周围环境的要求非常高[3]。
  在上述问题的基础上,下面文章中创建了一种SIFT算法的手势控制体系。
  一、针对手势控制系统的相关设计
  文章中的相关研究都是通过Windows操作系统平台来完成的,利用Matlab开发工具设计和开发了手势控制系统,借助普通攝像头和家用PC机,对手势进行识别,并成功控制了具体应用。我们可以大致把使用体系粉尘两大类:第一类是针对手部肤色的检测,第二类是针对SIFT算法的手势识别技术。
  1.基于肤色的手部区域检测
  不同的手势不会改变皮肤自身的颜色,在所有的图像中,手部肤色图像是比较稳定的。不仅如此,人们的手部在太阳光的照射下色彩几乎相同,并且色彩不会受到被检测者的年龄、性别、种族的影响,可以通过手部肤色收集手部区域的基础信息。
  因为普通摄像头收集到的图片是RGB彩色空间的,因此无法对其直接处理,一定要把其转换成YCbCr彩色空间,才能提升处理效果。
  文章中把收集到的图片进行图像锐化处理,然后在YcbCr空间中提取肤色区域,最后对处理得到的二值图像进行形态学运算,只有这样才能得到较为满意的手部区域图像。
  2.基于SIFT算法的手势识别
  经上一步的判断后,若摄像头采集到的图像中包含有足够面积的手部区域,则对其进行识别。本文采用SIFT算法对无背景干扰的手势进行识别。
  这种新型的算法的雏形是在上个世纪被人们发现的,随后人们又对其进行了总结创新。运用这种算法收集到的SIFT特征向量属于图像的一种普遍特征,如果我们可以确保其亮度保持不变、尺度缩放比例不变,就能够确保其噪声、视角变化比例等的稳定性[1]。
  SIFT算法主要有以下几点:
  首先,我们需要认真落实尺度空间的极值点。要想准确得到图像尺度空间,我们需要利用高斯函数来获取。
  其次,我们需要科学选择稳定的关键点。通过认真选择那些计算出的极值点,去掉其中的不稳定因素,进而提升关键点的稳定性能极其自身抵抗噪声的能力,为此我们可以参考文相关文献[2]。
  第三,我们应该把选好的关键点搭配相应的方向。要想确保SIFT自身的旋转不变特征,就应该准确找到特征点的主方向。然后结合不同的特征尺度选择相近的高斯平滑图像L,准确计算L上每一个点的梯度和方向,随后进行相邻窗口的采样分析,选用直方图直观呈现给人们所有点的梯度方向。
  二、实验结果与分析
  为了验证系统的有效性和准确度,本文选用了2种简单手势进行实验,对2种手势各采集1张,作为样本图像。两种手势对应的命令分别为开始、前进。
  经过相应的研究我们不难看出,手势控制体系的样本图像识别结果不会受到手指不同动作、手势缺失以及光照差异的影响。
  使用Matlab编写了简单的图像播放器、音频播放器,通过手势控制系统对两播放器进行操作。对每个播放器每种手势各使用50次,统计两播放器被正确控制的次数。
  三、结束语
  本文提出的方法对少量的手势识别效果较佳,如要求识别大量手势,则随着各手势间SIFT特征差异变小,识别结果容易出现错误。如果想取得比较好的效果,必须对现在采用的特征点匹配方法加以改进,提高特征点匹配准确率。同时,识别大量手势需增加样本图像的数量,将增加计算量和识别耗时,为解决这一问题需要对手势进行归类,识别时对待测图像进行粗分类,然后将待测图像与其对应类别中的样本图像进行匹配。下一步将研究上述两个问题的具体解决方案。
  参考文献:
  [1]Darid G. Lowe. Object recognition from local scale-invariant features [C].International Conference on Computer Vision, 1999: 1150-1157.
  [2]Darid G. Lowe. Distinctive Image Features from Scale-invariant Keypoints [J].International Journal of Computer Vision, 2004, 60(2):91-110.
  [3]刘寅,滕晓龙,刘重庆. 复杂背景下基于傅立叶描述子的手势识别[J].计算机仿真;2005,22(12):158-161.
其他文献
摘要:随着科技的发展,农业的耕作技术也在不断地提高,旧时的农具慢慢淡出了人们的视线,新型的农机逐渐出现在农作物耕作之中。我国属于农业大国,有广阔的土地资源,所以我国的农业生产过程中有必要大量使用农机,来增进农业经济,促进农业现代化水平。  关键词:农机;农业;现代化  中图分类号:F320 文献识别码:A 文章编号:1001-828X(2016)015-000-01  农机是农业发展过程中促进农业
本文通过对荣华二采区10
摘要:本文针对国内外的升降机状态监测与故障诊断技术进行了研究,并对矿井中升降机的常见故障进行了分析,提出了一种基于GPRS通信的矿井升降机故障自判断的系统。  关键词:矿井提升机;远程监测;故障诊断;维修决策  中图分类号:TD534 文献识别码:A 文章编号:1001-828X(2016)015-000-01  引言  矿山升降机在矿井进出中占有举足轻重的位置,当升降机在工作中出现隐形的故障而未
在社会主义新农村建设过程中,如何加快农村网络普及,建设“智慧乡村”,开辟农民创新创业新平台,助力农产品顺利销售是一个亟待解决的问题.为此,我们利用暑假期间走进平山革命
可变直流电源设备看似很简单,但它是一种极为复杂、准确而且耐用的高负荷电子设备。无论是阻性、感性、容性、低阻抗、高阻抗、稳态还是可变负载,电源设备都必须可靠地提供稳
为探究吕家坨井田地质构造格局,根据钻孔勘探资料,采用分形理论和趋势面分析方法,研究了井田7
期刊
摘要:国内基本建设正在如火如荼的发展,工程建设中的土建占据了一席之地。所以说怎样较好的改进制度,确保工期和质量双丰收成为当前施工控制的着重点。本文就工程施工进度管理和控制的地位进行了系列说明,随后,并着重分析了其中的因素。而且,还深刻研究了如何利用有效管理来强化进度控制,这都为我们工程建设提供了一些意见。  关键词:土建工程;施工进度;控制与管理  中图分类号:TU71 文献识别码:A 文章编号:
为探究吕家坨井田地质构造格局,根据钻孔勘探资料,采用分形理论和趋势面分析方法,研究了井田7
期刊
摘要:我国国土广阔,光能资源分布较为均匀,与水电、风电、核电等相比,太阳能发电没有任何排放和噪声,应用技术成熟,安全可靠,除大规模并网发电和离网应用外,太阳能还可以通过抽水、超导、蓄电池、制氢等多种方式储存,几乎可以满足中国未来稳定的能源需求。同时,太阳能是未来最清洁、安全和可靠的能源。鉴于此,本文就我国光伏产业发展中存在的相关问题进行分析,并提出几点合理化建议,希望能推动我国光伏产业的持续发展。