基于视频流人脸识别的课堂考勤系统的设计与实现

来源 :华中师范大学 | 被引量 : 0次 | 上传用户:xmzhkj
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
课堂考勤是课堂管理的有效手段之一,可以有效地监督学生按时上课,保证课堂的教学质量。目前学生的考勤是通过教学人员人工唱名、不定时抽查等方式来完成。这种传统的人工唱名方式不仅耗费大量的人力和时间,而且无法实时检测迟到、早退、代课和旷课等现象,无法对学生考勤做到全面监督。近年来,深度学习在静态图像人脸识别方面已经取得较大进展,为实现自动化课堂考勤系统提供了新的思路。但由于教室条件限制,大多数监控摄像机都安装于教室前方(或后方),不同位置的学生距离摄像机的相对位置差异较大,距离较远(后排)的学生人脸图像像素偏低,归一化裁剪后会呈现人脸特征不明显的现象,严重影响识别学生的正确率。在课堂环境下,人体的不停运动和姿态偏移等现象都会导致采样帧中人脸区域图像呈现运动模糊的问题,进而带来人脸特征不明显。上述的图像像素低和运动模糊等问题会严重影响识别算法的性能,从而导致整个课堂点名系统性能的下降。在课堂环境下如何通过控制摄像机保证人脸图像尺寸符合识别算法要求、如何在视频流中选取高质量的人脸区域图像以及如何有效利用采样帧中的单次识别结果统计获得最终识别结果便成为本文研究的三个主要问题。具体解决方法如下:(1)本系统通过多任务级联卷积神经网络(Multi-task convolutional neural networks,MTCNN)人脸检测方法获取人脸绝对位置信息,结合本文提出的课堂场景分割与摄像机控制方法,完成了基于人脸目标搜索的云台控制方法,有效地保证了对人脸区域图像尺寸(像素)的要求。(2)本文在传统人脸识别系统中引入了图像质量评估环节,通过该评估方法自动筛选出采样帧中人脸特征明显的图片,以提高人脸识别系统的有效性和鲁棒性。(3)在保证了人脸图像尺寸及人脸图像质量后,本文通过改进后的FaceNet结构提取人脸特征,并通过预训练完成的SVC(Support Vector Machine Classifier)分类器获得单次识别结果。结合多次有效的单次识别结果,提出了基于多有效帧的概率投票方法,最终提高了识别结果的准确性。
其他文献
近年来,在生物特征识别领域,说话人识别以其独特的安全性、经济性和准确性等优势受到越来越多的关注,并逐渐成为人们生活和工作中重要的身份验证方式,具有广阔的市场前景。说
3D电视技术能够增强视频观赏体验,近年来得到了高速的发展和应用。基于深度图像绘制(DIBR)的视图合成是3D电视的关键技术,它能够方便地合成任意视点的视图,实现3D内容的实时编辑
随着移动互联网时代基础设备与网络环境的优化改善,消费者的生活娱乐习惯发生了巨大转变。网络的内容主流和用户交流媒介正在由文本向图片或者视频过渡,视频移动化趋势势不可挡
IMMU (Instruction Memory Management Unit)指令存储管理单元,是微处理器的一个重要组成部分。其作用在于完成从虚拟地址(virtual address)到物理地址(phusical address)的
本文瞄准不确实信道下的有效、可靠通信,以信号处理、信息理论和传播物理为支柱,在广义似然比检验(GeneralizedLikelihoodRatioTest,GLRT)框架下,进行联合的信道估计、均衡和符号检
近年来,随着图像跟踪技术突飞猛进的发展以及人们对图像跟踪技术接触的不断频繁,越来越多的人意识到图像跟踪技术已成为人类认识和改造这个世界的重要手段。目前,图像跟踪技
台标识别是用来检测定位电视台台标并对其进行识别的过程。台标识别方法主要涉及图像处理、图像识别和模式识别等技术领域,它在基于内容的视频检索、节目收视率调查统计、电
随着移动通信技术的快速发展,特别是3G技术的发展,基于移动台位置的服务已经成为了运营商最主要的增值业务形式之一,因此对蜂窝网定位技术研究具有重要的实用价值。我国拥有
无线多媒体传感器网络(Wireless Multimedia Sensor Networks, WMSNs)是一种新型的无线传感网络,采用具备较强的视频和图像等多媒体信息的处理能力的多媒体传感节点,被广泛应用
随着教育信息化的发展,教育大数据越来越受到重视。基于大数据技术来挖掘隐藏的学生活动规律信息,为学生提供更加丰富的“成绩单”,进而刻画学生画像。这对于发现学生的异常