基于深度学习的教室学生行为目标检测算法研究

来源 :天津大学 | 被引量 : 0次 | 上传用户:weibo78500
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,计算机视觉领域获得了飞速发展,基于深度学习的目标检测作为该领域的重点研究方向,也取得了一定的研究成果。但其依旧存在对中小物体识别精度差、检测速度迟缓等问题,且对一些特定场景如教室的学生行为检测等缺乏应用研究。将目标检测算法运用到教育教学场景,可以有效反馈老师课程质量和学生听课状态,为学校改良教学方式提供重要参考,具有很大应用前景和价值。因此本文重点研究了在教室场景下对学生写字、举手、听讲、起立回答问题、睡觉这五类行为目标进行检测的方法。基于上述讨论,本文参考YOLOv3、YOLOv4算法,设计了新的目标检测算法。主要开展了三个方面的工作:首先,设计了轻量级网络Dual-Mobile Face Net,有效地将通道加和通道拼接操作融合起来,提高运算速度的同时也加强了网络提取低层特征的能力;其次,设计了新的候选框策略,包括先验框初始化和候选框筛选策略两部分,前者使先验框更合理、分布更加均匀广泛,对不同尺度物体匹配度也更优,后者则提升算法对密集、被遮挡目标的敏感性,两者结合可提高精度并降低漏检率;最后,设计了新的算法结构,引入空洞卷积分支并改善了预测结构,空洞卷积分支可以强化算法对物体细节信息的提取,进一步提高算法检测效果,而改良的预测结构则参数更精简,对低层特征提取效果更佳。为验证算法效果,将本文算法在自制教室行为图片数据集、PASCAL VOC和MS COCO数据集上进行实验,平均精度均值分别达到91.12%、81.72%和61.6%,优于YOLOv3算法,证明了本文算法的可行性、泛化性和优越性。同时,出于将目标检测算法应用于教室场景学生行为检测的研究目的,设计了应用实践,将算法移植于Jetson TX2嵌入式开发板并模拟教室场景用云台摄像头录制了8人前排、8人后排与18人视频进行实验。平均精度均值分别达到94.04%、88.55%、91.36%,预测速度22.5FPS,精度较好且满足实时应用的需求,证明了本文算法的实用价值,也可为目标检测算法在其他方面的应用提供思路。
其他文献
音频场景识别旨在用计算机分析音频信号所处的环境信息,具有重要的研究意义。音频场景识别方法对输入的声学特征表示进行特征提取,并利用得到的声学特征分类场景类型。随着大数据技术和高性能处理器的发展,基于深度学习的音频场景识别方法通过监督学习策略,解决了传统方法对高维多分类复杂关系建模的难题。然而,现有的方法在实际应用时仍面临算法针对性不强、训练数据量不足、计算复杂度过高和模型可解释性差等问题。因此,本文
学位
雾天采集到的图像存在对比度下降和色彩偏移等问题,降质图像会严重影响计算机视觉系统的处理性能,图像去雾研究具有重要的理论意义和现实意义。本文深入研究基于深度学习的去雾方法,并针对现有端到端去雾网络存在去雾不彻底、细节模糊以及颜色失真等问题提出两种去雾新方法,主要工作如下:针对现有去雾网络对图像特征提取不完整、网络模型泛化能力不足等问题,本文基于卷积神经网络设计了一种基于内容特征和风格特征融合的去雾网
学位
<正>陕西省宝鸡市城市管理执法局以建设法治政府和法治城管为目标,以法治建设反馈问题整改和示范创建为抓手,扎实推进依法行政、文明执法,取得积极成效。2022年,宝鸡市城市管理执法局被宝鸡市司法局评为法治建设优秀单位。深入学习习近平法治思想
期刊
3D视频在2D视频的基础上增加了视点数目和深度数据,其数据量要远大于2D视频,给视频的存储和传输带来了巨大的挑战。因此,如何实现高效的3D视频压缩编码具有重要的理论研究意义和实际应用价值。近年来,随着人工智能技术的发展,深度学习在视频处理领域得到了有效应用,为3D视频压缩编码提供了新的发展思路。为了进一步提高3D视频编码效率,本文借助于深度学习技术,利用3D视频的空域、时域和视点域相关性,开展了基
学位
随着三维数据采集、可视化、硬件设备的技术升级以及互联网行业的快速发展,三维模型已经成为一种主流的多媒体方式。如何在大量数据中检索到相似的三维模型已成为一个至关重要的研究课题。通常解决方法分为两类,分别为基于模型的检索算法与基于视图的检索算法。早期的方法主要是基于模型的算法,需要直接从明确的三维模型中学习拓扑结构、骨架信息等。基于视图的算法以不同的视图表示三维模型,并经过若干卷积层、池化层、全连接层
学位
阿尔茨海默症(Alzheimer’s Disease,AD)是一种不可逆的神经退行性疾病。当AD患者在临床上出现症状时,病情通常已经发展到了晚期,医疗干预无法再对患者产生积极作用。因此利用神经影像技术在病变之前发现患者脑内异常的变化并进行早期干预,对AD的早期防治具有非凡的意义。然而如何有效地利用神经影像技术提高AD诊断的准确率仍然存在较大的问题,为此本文从单模态和多模态两个方面来探讨AD分类中的
学位
<正>2022年,广西壮族自治区防城港市城市管理监督局(以下简称“防城港市城管局”)不断推进城市管理综合执法改革,加大对市容环境卫生、建筑垃圾等领域的监管处罚力度,法治建设工作成效明显。建立健全法治工作推进机制2022年初,防城港市城管局主要负责人在党组会议、党组理论学习中心组组织学习中央全面依法治国工作会议、中央依法治国委员会会议精神和习近平总书记重要讲话、重要指示批示精神,
期刊
目标检测一直是计算机视觉领域最热门的研究课题之一。传统的目标检测方法大多基于手动设计的特征提取策略和滑动窗口的区域选择策略,鲁棒性较差、时间复杂度较高。近年来,随着具有强大特征提取能力和局部感知能力的卷积神经网络(Convolutional Neural Network,CNN)广泛应用于计算机视觉领域,目标检测算法的精确度和速度都得到了大幅提升。其相关技术已广泛应用于智能交通、工业制造、军事国防
学位
人的微表情变化通常发生在一个人试图隐藏真实感受的情况下,与常规面部表情相比,它具有持续时间短、动作强度低的特性,能够揭示出与人们内心真实活动有关的信息。近年来,微表情识别因其在犯罪检测、商业谈判、刑事审讯等领域有重要的应用价值而逐渐引起了研究者的关注。根据所使用的数据源种类,微表情识别可以在单一数据域和交叉数据域上进行研究。然而目前微表情识别研究仍处于初始阶段,主要存在以下问题:一是微表情数据库不
学位
右玉精神融入大学生思想政治教育有利于学生生动理解马克思主义的精神特质,有利于坚定大学生的崇高理想和远大追求,有利于精准助力高等院校的人才培养。高校应在教师队伍、实践研学、网络育人、校园宣传等四个方面齐抓共管,进行有益的实践尝试。
期刊