【摘 要】
:
对患有听力障碍的人群来说,手语是其日常生活工作中必不可少的沟通交流方式。传统手语识别模型包含手势图像预处理、手语手势区域检测、手语手势特征提取及手语识别等过程,其识别过程繁琐,算法复杂度高。因此,在有光照干扰的复杂背景中,传统手语识别模型的识别率较低,难以获得理想的识别效果。针对传统识别模型中存在的问题,本文从深度学习方法在目标检测领域中的应用方面入手,建立了一个基于改进YOLOv3(You Lo
论文部分内容阅读
对患有听力障碍的人群来说,手语是其日常生活工作中必不可少的沟通交流方式。传统手语识别模型包含手势图像预处理、手语手势区域检测、手语手势特征提取及手语识别等过程,其识别过程繁琐,算法复杂度高。因此,在有光照干扰的复杂背景中,传统手语识别模型的识别率较低,难以获得理想的识别效果。针对传统识别模型中存在的问题,本文从深度学习方法在目标检测领域中的应用方面入手,建立了一个基于改进YOLOv3(You Look Only Once v3)算法的手语手势识别模型。首先,本文选取数学中较为常见的十类基本手语手势:加、减、乘、除、直角、锐角、三角、倍、垂直、量角器,并在四种不同的背景下对此十种手语手势进行视频采集。其次,将采集的视频数据转换成对应的一帧一帧图像,并在前三种背景下选取每类手势图像3600张即一种背景下1200张图像数据,将其作为训练集。然后,在第四种背景下选取每类手势图像500张共5000张,将其作为测试集。最后,依据前期预实验中出现的问题并结合手语手势形状特点,对YOLOv3算法的检测尺度层进行了四次调整,其分别为:大尺度检测层调整为小尺度检测层、大尺度检测层调整为中尺度检测层、大和小尺度检测层调整为中尺度检测层、大和中尺度检测层调整为小尺度检测层,同时选取Selu函数作为改进模型的激活函数。针对改进后的识别模型,首先,应用自制手语训练集对其进行训练及测试,识别模型的平均识别准确率为99.73%。其次,使用公开Sebastien Marcel手势数据集对建立的手语识别模型进行训练及测试,平均识别准确率为94.58%。最后,通过对两次实验数据分析可知,相较于传统手语识别模型,本文采用的手语手势识别模型在识别率上有了很大的提升,其具有很好的研究应用价值。
其他文献
先秦至今历代龙舟竞渡文献资料及竞渡起源诸说表明,龙舟竞渡起源于先民的生产、生活,春秋战国时期融入纪念意义。各地、各民族原本差异很大,后世在文化传承过程中,纪念屈原成为共
针对目前蜗杆传动侧隙可调、体积小、重量轻的发展趋势,王进戈提出了一种新型蜗杆传动形式——变齿厚内齿轮包络外转子鼓形蜗杆传动,并申请了发明专利。由于蜗轮蜗杆之间为内
国家“十五”期间已经启动生物质能源发展计划,然而对于木薯等淀粉源作物生产燃料乙醇的技术与经济问题尚缺乏明确的答案。本研究在对广西、海南木薯酒精企业和原料生产实地
本文以林语堂先生的著作Moment in Peking为例,并结合张振玉的译本深入挖掘中国特色的文化符号,以探讨China English的文化传播可接受性及其传播的重要性。
据国外媒体报道,西班牙毕尔巴鄂市(Bilbao)的废铝回收再生企业--贝福萨阿萨公司(Befasa Asua)最近投产了一台全球最大的废铝旋转倾动式熔炼炉(容量65 t),经过几个月的生产运
请下载后查看,本文暂不支持在线获取查看简介。
Please download to view, this article does not support online access to view profile.
我国特殊的财政分权体制促使地方政府在实现辖区经济发展上占据主要地位,导致地方政府有动力通过加剧地区间竞争来促进当地经济发展,这一“增长型激励”特征通过资源不平等配置和制定城镇偏向性的政策等方式导致了收入差距居高不下的结构性问题。而城乡收入差距作为影响居民收入差距的重要因素,对优化收入分配格局、实现经济平稳运行具有重要意义。从中国经济快速增长与城乡收入差距居高不下的现状出发,以2008-2017年我
木聚糖是半纤维素的主要构成成分,其含量在自然界中仅低于纤维素,因此木聚糖是一种非常重要的可再生资源,工业上主要用于生产低聚木糖等。木聚糖酶(β-1,4-xylanase)能专一地水
<正> 历史的实在是独立于研究者之外的客观存在。用文字记录下来的历史是通过研究者主体意识加工之后的成果。组成这些成果的最小单位是历史名词,或叫做历史概念。包括历史学
目的:种植修复治疗的成功标准,随着种植技术和材料的不断成熟,已从最早的存活率到长期的稳定性,进阶到需具有理想的美学效果,特别是前牙美学区。如何评价种植修复体的美学效