非线性KP-Detector模型在人体姿态识别中的应用

来源 :杭州电子科技大学 | 被引量 : 0次 | 上传用户:xiaochouya87
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,为了推动行为检测识别的应用研究发展,许多专家学者投入人体姿态识别技术的研究。传统的体态检测方法包括特征融合、代数计算、模糊模式算法、OS-KELM算法等,这些方法难以应对人体识别中出现的角度变化以及尺度变化等情形。再后来提出了一些经典的深度学习模型,比如Simple Baseline、CPN(Cascaded Pyramid Network)、SHN(Stacked Hourglass Network)、Dense Pose等,这些模型虽然都能表现出较好的识别效果,但仍然存在着检测精度不足,检测周期过长以及模型参数规模过大等问题,因此本文提出了一种新的体态识别模型——KP-Detector。具体内容如下:(1)针对人体姿态识别中关节点连接不精确的问题,提出改进的PLF(Point Line Fields)匹配方法做关节点连接。传统的关节点连接技术是根据检测到的置信度最接近的两个关节点进行连接匹配的,这样的连接方式会随着某一个关节点检测结果出错,导致得到的肢体发生较大的偏移,而本文使用了指数-对数非线性化改进后的PLF方法解决了这种问题,增加了关节点之间的方向信息,对肢体上的每个点的权重都做了非线性映射放大隐藏信息,使得匹配结果更精确。(2)针对识别网络易产生梯度消失以及参数过多的问题,提出残差块间的Dense连接方案。在关节点定位模块部分使用了4块重结构,在肢体置信度模块使用了2块重结构,两种模块的不同重结构之间都是以Dense形式连接在一起的,所有输出都经过权重与输入相连。这样保证后面的重结构可以充分利用到前面重结构的信息,实现参数的共享,减少了模型的复杂度,提高模型检测速度且缓解了模型的梯度消失问题。实验结果显示本模型的检测精度优于对比模型,测试速度较其他模型快近4FPS,模型大小只有18M。说明使用本模型相比于其他模型性能更加优异,验证了本文提出的Dense连接机制、PLF匹配方法应用在模型中的优越性。
其他文献
主动声呐工作在复杂的海洋环境中,多途、海深、声速梯度、温度等诸多因素都会影响水中目标散射声场,尤其是隐身目标和各种小目标的出现,导致目标特性微弱,很难提取出利于识别的稳定而可靠的目标固有特征。面对该问题,本论文重点关注海洋信道中有目标和没有目标时的声场变化,从理论仿真、特征提取、试验数据获取分析三个方面,研究海洋信道环境声场、主动声呐目标散射声场产生的干涉条纹特征,为目标的探测和识别提供一种有效的
近年来,在智能机器人领域,工业无人巡检机器人、矿山爆破机器人等的应用越来越广泛。SLAM技术作为机器人实现智能化、自主化的关键技术之一迅速成为智能机器人领域重点关注的技术。SLAM问题中一个需要解决的难题就是量测数据和诸多地图特征的数据关联问题。基于数据关联和卡尔曼滤波器的SLAM算法利用数据关联来解决这个问题,在关联场景简单时取得了良好的效果。但是在环境中杂波较多、传感器存在大量漏检的情况下,基
我国领海辽阔,海洋资源丰富。舰船作为海洋活动的主体,实现舰船目标的准确识别对于海洋强国建设至关重要。目前,舰船目标数据的采集方式多样,主要有星载、机载、无人机载、舰载、船载和岸基等,不同采集方式所获得的图像数据之间存在一定差异;利用某一平台图像数据得到的舰船目标深度识别网络无法直接应用到其他平台,这是由于平台之间存在观测视角和图片分辨率等多种差异。因此,本文重点开展了基于深度迁移学习的舰船目标识别
滤波器设计方法与技术一直是学术领域研究的热门课题之一,近些年来已得到了长足的发展。目前,虽然以线性卡尔曼滤波器设计为基础的理论和方法已形成一个较完整的体系结构,但现有面对非线性系统所设计出的卡尔曼滤波器,常随非线性程度的增强,而性能在逐步退化;以函数近似为主的扩展卡尔曼滤波和强跟踪滤波,无法在根本上解决由于舍掉泰勒展开式的高阶项带来的线性化误差;以采样近似为主的无迹卡尔曼滤波不关注具体的函数形式,
近年来,随着计算机算力的不断增长,计算机视觉领域依托深度学习的方法取得了显著的进展,车道线检测领域也乘着这阵东风飞速发展。虽然现有的基于深度学习的车道线检测算法在鲁棒性等方面远超传统算法,并在某些简单场景中的检测性已经能够很好的满足实际应用的需求,但是在光照分布不均、车流量大、车道线磨损、夜晚、地标箭头干扰等复杂道路场景中,算法性能不容乐观。因此本文尝试在现有的两种基于CNN的车道线检测算法上进行
对称α稳定(Symmetricα-Stable,SαS)测量噪声下鲁棒纯方位目标定位是被动目标定位领域的一个重要课题,被广泛应用于电子侦察、阵列网络、无线定位和机器人导航等领域。不同于高斯测量噪声,SαS测量噪声没有统一闭式概率密度函数且不存在二阶及以上统计量,鲁棒纯方位定位的优化准则变为最小散度准则,即最小Lp范数准则。典型的迭代重加权伪线性最小二乘(Iteratively Reweighted
近年来,风电场规模越来越大,如果对大型风电场的每台机组进行详细建模,会增加运算规模、耗费大量时间。因此,有必要对风电场等值建模方法进行深入研究。而随着风电场及电网复杂化,故障情况常常会导致无功功率不足,致使系统电压及功率因数降低。静止无功发生器(SVG)被越来越多地应用到电网及风电场中以补偿无功和稳定电压,但实际情况中SVG往往无法提供准确参数,仿真时大多使用典型参数,因此,亟需对SVG的控制器参
大规模多输入多输出(Multiple-Input Multiple-Output,MIMO)技术可以有效地提高无线通信系统性能,而信道状态信息(Channel Status Information,CSI)的特征对系统性能有至关重要的影响。利用导频信号进行信道估计获得信道状态信息是常用的信道估计方法之一,即在发送端将一定数量的导频序列加入到发射信号中一起发送,接收机通过适当的处理技术分别获得导频点
虚拟现实(virtual reality,VR)技术凭借沉浸式视觉体验的优势,越来越多地应用于脑卒中运动障碍的康复治疗。动作视觉感知下镜像神经元系统与感觉运动皮层的功能整合是动作观察应用于脑卒中运动障碍神经康复的理论基础之一。相比于传统的动作观察,VR技术的优势在于其沉浸式的视觉体验,但这种视觉上的体验变化是否能进一步促进镜像神经元和感觉运动皮层的功能整合?VR场景下对本体动作的视觉感知体验,预期
新一轮互联网技术变革的兴起和成熟,倒逼传统行业在发展道路上转型升级,在此背景下,我国现代物流业也逐渐步入与互联网产业深度融合的时代。物流业在过去十多年经历了高速发展的过程,但根据近年数据来看,目前我国物流业内增速逐渐放缓,物流成本由快速下降期进入平台期。作为我国经济实力较强、发展潜力较高的江浙沪地区,物流业的发展不容小觑。物流业的发展态势和江浙沪地区各城市经济的发展相辅相成,物流产业的规模和体量在