【摘 要】
:
随着计算机技术的发展,人工智能逐渐在日常生活中扮演起越来越重要的角色。计算机视觉作为人工智能领域的重要分支,它旨在让机器像人那样对看到的事物作出反应。恰逢如今进入视频大爆发的时代,各种平台、监控等无时无刻不在产生着大量的视频数据,而这些数据根本无法完全依靠人力去处理,因此需要视频理解的智能算法来提升效率。人作为视频内容的主体,是视频分析技术的重点关注对象。准确地对人体行为进行分析,是视频分析和理解
论文部分内容阅读
随着计算机技术的发展,人工智能逐渐在日常生活中扮演起越来越重要的角色。计算机视觉作为人工智能领域的重要分支,它旨在让机器像人那样对看到的事物作出反应。恰逢如今进入视频大爆发的时代,各种平台、监控等无时无刻不在产生着大量的视频数据,而这些数据根本无法完全依靠人力去处理,因此需要视频理解的智能算法来提升效率。人作为视频内容的主体,是视频分析技术的重点关注对象。准确地对人体行为进行分析,是视频分析和理解的关键问题之一。在实际应用中,不仅视频行为的类别需要被分辨,行为的起始点和结束点也需要获取,这使得视频行为识别和视频行为定位成为该领域的热点。由于depth信息能够展现人身体不同部位的前后关系,从而呈现出更多的动作细节,本文将主要研究以RGBD数据作为输入的行为识别;另外,不包含行为边界详细标注的弱监督行为定位能够大量减少人力消耗,具有更好的实用价值,因此本文的另一项研究内容是弱监督的行为定位。虽然前人针对这两项任务已经提出了许多的方法,但是仍然存在着众多的挑战和困难。本文针对这些问题进行了研究,主要工作如下:(1)首先针对多数RGBD行为识别方法中depth信息时序特征提取被忽略以及不同模态之间关系没有被端到端的提取和融合的问题,本文提出了基于3D共有-特有框架双流网络(Two-Stream Network with 3D Common-Specific Framework,TSN-3DCSF)的RGBD行为识别方法。该方法以TSN网络作为基础,使用RGB视频帧和depth视频帧作为输入,利用4个互不共享参数的3D卷积块提取共有-特有特征,最终联合训练相似性损失,非相似性损失以及分类损失来优化网络参数。本文在多个RGBD行为识别数据集上进行了大量实验,结果证明了所提出方法的有效性。(2)其次针对弱监督行为识别中完整性和可分性的两大挑战,本文研究了特征擦除的基本思想,提出了基于深度片段选择网络(Deep Snippet Selective Network,DSSN)的弱监督行为定位方法。该方法主体包含四个分支:一条注意力分支用来产生类无关的注意力分数增强分类效果;两条擦除分支在擦除最具有判别性特征的同时给网络提供了关于背景的先验知识;一条背景抑制分支进一步压制背景特征的激活。通过这多条分支的共同作用,本文的方法实现了对完整性和可分性的保证。在两个广泛使用的数据集上的大量实验证明了所提出方法的有效性。
其他文献
动力锂离子电池(简称锂电池)作为电动汽车能量来源的动力源,其使用寿命会随着锂电池的充放电次数的增加而降低。当动力锂电池的使用寿命退化到一定阈值时,我们就需要对其进行回收处理。如果大批量的退役动力锂电池,直接进行回收处理,就会造成能源的巨大浪费。如何从可持续发展角度考虑使大批量退役动力锂电池变废为宝是一个值得深入研究的问题。基于此,本文以退役动力锂电池为研究对象,针对大量退役动力锂电池,提出一种退役
核反应堆在正常运行和事故工况下的热工水力特性对于反应堆的安全至关重要,目前主要依靠热工系统程序对核反应堆的热工水力特性进行安全分析。中国核电发展前景广阔,但国内的热工系统程序的核心模型都来源于国外程序说明书中的相关模型,为了中国核电技术的发展和走出去,有必要开发具有自主知识产权的核反应堆热工系统程序。核反应堆热工系统程序自主知识产权化的关键在于开发出能够准确反映核反应堆中出现的两相流现象特性的物理
我国每年都会产生大量的剩余污泥和餐厨垃圾,这两种物质逐渐成为主要的城市生物质有机废弃物,不妥善处理将会对环境造成严重的危害。由于我国剩余污泥的有机质含量少,所以直接厌氧消化的资源回收率偏低。虽然餐厨垃圾的有机物含量高,营养丰富,但单独厌氧消化容易酸化产生抑制。鉴于二者不同的性质与单独消化的表现,共消化是提升其甲烷产率和系统稳定性的重要手段。污泥水解产碱有利于缓冲餐厨垃圾酸化所形成的过多有机酸,继而
目的 回顾性分析后外侧入路内镜下腰椎融合术(posterolateral endoscopic lumbar interbody fusion, PELIF)治疗腰椎滑脱症的疗效和手术安全性。方法 回顾性分析本科自2019年1月~2020年3月开展PELIF手术治疗的31例腰椎滑脱症患者,滑脱节段:L3-4 3例,L4-5 21例,L5-S1 7例;滑脱程度:Ⅰ度25例,Ⅱ度6例。统计患者围术期指
有机胺吸附材料吸附二氧化碳(CO2)的本质是有机胺分子与CO2的分子间弱相互作用。从分子水平上研究有机胺分子与CO2的分子间弱相互作用的作用位点及类型,并揭示其成键规律及复合物结构,是深入了解CO2吸附机理的基础,对于优化设计CO2捕获的新材料和新方法具有重要意义。高分辨傅里叶变换微波光谱技术结合理论计算研究分子间弱相互作用,可以有效排除凝聚态中晶格效应或溶剂效应的影响,能提供准确的分子结构参数、
通过路测交通单元实现精准感知是高速公路建设的基础和实现智慧交通的前提,但是仅采用雷达或视频采集的传统感知方式无法满足感知精度、全程连续跟踪及特殊天气下感知能力等方面的要求。本文以京雄智慧高速河北段建设为背景,提出一种基于融合超远距高精度雷达和视频融合的高速智能体感知系统。该系统的云、路、车三个子系统充分协同融合,实现了高精度、全时全天候事件检测和全程轨迹连续,增强了交通运输运管理的预见性、主动性、
随着我国利率市场化改革的不断加深,商业银行面临的利率风险越来越高。在我国存款保险建立和深化改革利率市场同时进行时,研究存款保险制度是否可以有效约束银行面临的利率风险是有价值的,可以让国家更加有目的地制订风险管理战略。目前国内学者已经进行了许多存款保险制度对我国商业银行破产、市场等风险影响的分析,但是关于对中国国内商业银行利率风险影响的分析成果很少。论文从银行特质和商业银行利率风险测度管理这两个角度
语文教学应关注学生的学习目标,从单元出发,整合单篇文本,设计有效的语文学习活动,让学生成为学习的主体,最终完成单元学习目标,提升语文核心素养。
砂石作为混凝土的主要原材料,其质量对混凝土各方面性能起着至关重要的作用,而含泥量是影响砂石质量的关键因素。泥是一种含有较多成分的复杂物质,目前关于含泥量对掺有聚羧酸减水剂的砂浆和混凝土性能影响的研究较多,但从泥中所含粘土矿物组成角度出发进行试验研究的案例较少,此外对于机制砂中含泥量也没有明确的限定。因此,有必要深入研究泥粉中不同粘土矿物组成和含量对水泥水化和混凝土性能的影响,对今后机制砂中含泥量的
糖是重要的营养物质和供能物质,还参与生物体内数量惊人的生化过程。葡萄糖的过量摄入与Ⅱ型糖尿病有直接关系;果糖的过量摄入也可能会增大心血管疾病和痛风的概率。基于硼酸可以与二醇类物质可逆形成化学键的原理,硼酸糖传感器日益走进糖识别研究舞台中心,得到科学家们的青睐。双组份硼酸体系创新性地将荧光基团部分与硼酸受体分离开,让硼酸部分充当糖的识别受体和荧光猝灭剂两种角色。吡啶硼酸与荧光团8-羟基芘-1,3,6