基于深度学习的室内人员检测算法研究

来源 :天津大学 | 被引量 : 0次 | 上传用户:heheaixixi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着摄像头的广泛铺设和互联网普及,针对室内场景的空岗判定、智慧家居和人流量统计等智能视频分析系统也快速发展,以上功能的实现都要建立在室内人员检测的基础之上。但目前对检测算法的研究主要针对室外行人,室外行人取材场景开阔,数据集中的图片大多采用平行机位拍摄,人体目标较为完整。而室内人员多是俯视拍摄,容易出现家具带来的遮挡问题,且室内人员姿态多样,致使同一个体在不同状态下也会呈现较大差异。这些原因导致主流检测算法对室内人员的检测效果并不理想。
  针对以上问题,本文提出了一种高精度的室内人员检测模型。该模型以RetinaNet网络为基础,针对室内人员检测数据集进行改进。模型主要特点如下:在残差网络中引入通道注意力模块,该模块可对特征图的权重进行重新调整,增强特征表述能力;将改进的残差网络和特征金字塔并联作为骨干网络,这种设计方式可以对各级特征进行有效融合;针对神经网络容易出现的过拟合问题,本文利用通道注意力机制间接实现卷积层的随机失活,增强模型泛化能力;通过维度聚类算法找出锚点的最佳尺寸和宽高比,并据此找到合适的特征图进行预测。
  最后,本文在室内人员检测数据集上进行相关实验,与其他主流算法进行性能比较。实验结果表明,本文算法在室内人员检测数据集上检测精度可达99.8%,漏检率仅有0.045%,一张图片的处理时间仅要54ms,内存占用方面也优于其他主流算法,具有更强的并行处理能力。可视化结果表明,本文算法对形变、遮挡、多视角和复杂背景下的室内人员都能有效处理,具有极强的鲁棒性。
其他文献
水声多载波通信技术是当今水下通信中应用最为广泛的一种技术,具有传输速率高、鲁棒性好以及传播距离远等优点。但是,水声通信信道具有带宽受限、多径效应严重、多普勒效应严重等特点,多载波通信在水声通信方面依然面临着许多挑战。其中严重的多普勒效应对多载波通信影响巨大。  本文设计了一种新型的多载波调制方式,提升系统传输效率,并添加合适的多普勒估计补偿技术,用于水声通信系统中,提升多载波通信系统的传输性能。本
学位
随着互联网规模的爆炸式增长,雾计算、人工智能等创新技术的不断发展,互联网加速了由“通信信道”向“数据处理平台”的角色转变。在此情况下,一种以网内缓存为特色、面向通信内容的新型互联网架构——命名数据网,于2010年被提出并迅速得到国内外学术界的广泛关注。然而,命名数据网各领域的研究尚有大量技术瓶颈需要解决,特别是其内容路由器转发平面,仍然面临着诸如快速检索差异化名称数据、高效存储转发信息、有效支持名
随着信息技术的飞速发展,电子信息技术在如今的战争局势也发挥着越来越重要的作用。在电子对抗领域,对非合作目标源的定位问题一直是国内外学者广泛研究的热点。区别于雷达等对辐射源发射信号并接收回波的有源探测方式,无源定位是通过检测和估计辐射源的电磁波参数来确定辐射源位置。由于多站联合定位的方式效率低下并且风险较大,因此本文对实际应用更为灵活的单站无源定位展开研究。  本文主要对无源感知问题中的目标定位模型
学位
特征选择是维数约简的一种重要手段,其通过保留有效特征,消除无关和冗余特征,从原始特征集中选择一部分特征构成特征子集,从而达到数据降维的目的。然而,现有的一些特征选择算法难以保证在选择过程中同时考虑特征的相关性、冗余性和交互性三方面性质,导致算法的特征选择性能有限。此外,随着深度学习技术的发展,卷积神经网络在各个领域的应用越来越广泛,其常被用于提取图像特征,但大多数特征选择算法针对的都是传统的数据集
随着科学技术的不断发展和提高,立体显示技术被越来越广泛地应用在人们生活工作的各个领域。但是由于当前立体显示技术大多基于立体视差原理,视差所引起的辐辏调节冲突会引起观看立体影像时出现视觉不舒适的现象,降低了观看体验。因此,对于辐辏调节冲突对立体影像视觉舒适度影响的认知研究具有十分重要的意义。  本文首先采用脑电技术对单一视差所引发的视觉舒适度进行研究,提取了视差引起的舒适与否两类脑电信号的特征。将客
机器人技术涵盖众多的学科,包括机械制造、传感器应用和识别、电子技术、自动化与人工智能等。近些年,自动化技术和人工智能技术的不断发展大大推动了机器人技术的进步。根据应用场景不同,可将机器人分为工业机器人、农业机器人、家用机器人、医用机器人等。随着机器人的发展和大范围应用,对机器人智能化的要求越来越高,其中自主导航水平是评价一台机器人智能化的关键指标,而路径规划是机器人导航的重要组成部分。  路径规划
学位
光学乐谱识别作为乐谱内容符号化的关键技术,有助于音乐文件的存储与编辑,在音乐信息检索和计算机辅助教学等领域还有着重要应用价值。基于通用框架的光学乐谱识别算法存在处理步骤较复杂、精度较低等问题,而基于深度学习的算法虽有效地简化了通用框架,但其识别精度有待进一步提升,对于难点音符的识别误差较大,模型训练耗时久。为此本文提出一种改进的卷积循环神经网络光学乐谱识别方法。  本文中提出的光学乐谱识别算法主要
随着科学技术的日新月异及生活方式的改变,人们对位置信息的要求越来越高。在室内环境中,由于建筑物的阻挡等因素,全球导航卫星系统(Global Navigation Satellite System,GNSS)信号会发生衰减,GNSS难以满足人们对室内定位的需求。因此,众多室内定位解决方案层出不穷,其中基于行人航位推算(Pedestrian Dead Reckoning,PDR)理论的室内定位与跟踪技
火灾是人们日常生活中一种频繁发生且危害巨大的灾害事故。随着城市建筑向越来越高和越来越密集的趋势发展,火灾一旦发生,将严重威胁人们的生命财产安全。准确及时地检测到火灾发生对于防火救火具有十分重要的意义。传统的火灾检测技术多基于烟雾、光、热等多种火灾参数传感器来探测火灾,然而其受探测距离、安装位置等多种因素限制,报警速度慢、准确率低。进入21世纪以来,人类社会迈入高度的信息化时代,基于图像型的火灾检测
学位
三维模型技术随着信息技术的迅猛发张取得了广泛的应用,三维模型存在于人们生活的方方面面,例如三维建模、三维重建、3D电影、三维体感游戏和三维医疗等。特别地,得益于已经在各行各业逐渐普及的三维模型拍摄设备,每天都有海量的三维模型被分享到网络平台,相应的产生了大量三维模型数据集。然而,其中只有小部分用于学术研究的数据集具有详细和相对准确的人工标注,大部分三维模型数据库,尤其是用户端三维拍摄设备获取的三维