【摘 要】
:
行为检测旨在通过智能算法自动地定位视频中感兴趣行为,并判断行为的类别。行为检测是计算机视觉研究领域一项极其重要且困难的研究任务,其研究成果可被广泛应用于智能监控系
论文部分内容阅读
行为检测旨在通过智能算法自动地定位视频中感兴趣行为,并判断行为的类别。行为检测是计算机视觉研究领域一项极其重要且困难的研究任务,其研究成果可被广泛应用于智能监控系统、海量视频检索、机器人视觉、非法视频检索等领域。本文针对现有基于深度学习的行为检测方法中特征提取网络的表达能力不足和对行为构成的建模不足等问题展开研究,具体研究工作如下:首先,本文构建了一个红外行为检测数据集,以弥补由于缺少红外行为检测数据集而引起的红外行为检测研究空白。该红外检测数据集覆盖不同角度、光照等多个场景,能够很好地模拟真实环境。同时,介绍了两种常用于可见光视频数据的深度学习行为检测框架,以便本文展开基于深度学习行为检测的研究。其次,行为识别是行为检测的核心模块,而现有行为识别方法中特征提取网络存在学习能力不足的问题。为此,本文提出了一种基于多级平衡特征金字塔的红外行为识别方法,并将其应用于后续的行为检测方法中。传统的卷积神经网络往往不断加深网络层来获取更好的表达能力,忽略了对浅层特征的运用。本文提出的方法使用并行的卷积块来构成特征金字塔以保持不同分辨率的特征。同时,使用相同深度的语义特征产生特征金字塔,以此来达到特征平衡的目的。最后,使用非局部注意力机制增强不同分辨率特征。与传统的深度学习网络框架相比,实验结果表明,该方法能够同时使用不同分辨率的特征用于行为分类,有效地提升行为识别的效果。最后,本文结合上述提及的行为识别算法提出了一种基于高斯核函数时域生成策略的红外行为检测方法。该方法在本文构建的红外行为检测数据集上展开研究,吸收现有行为检测方法中行为评分分组算法的优点,充分利用了高斯核函数行为时序信息建模能力。具体地,该方法使用高斯核函数学习一维特征图上每个单元时域候选区域的表达方式。同时,使用高斯核函数分组算法将有关联的高斯核函数合并成新的时域候选区域。实验结果表明,该时域候选区域生成方法比其他方法有更好的行为时间边界定位能力,提升了行为检测算法的性能。
其他文献
酸性磷酸酶(ACP)是一种广泛存在于生命体内的水解酶,参与多种生理过程。作为前列腺癌等疾病的血清标志物,ACP活性监测对相关疾病的早期诊断具有重要的临床意义。现有的众多ACP
模型驱动的软件开发方式(Model-Driven Development,MDD)目前被广泛应用于面向服务架构的信息系统中,而模型转换作为MDD中的重要环节和核心技术,它的正确性直接影响了基于MDD
统计数据显示:约四分之三的游客在出游前都会去登录主流旅游网站查看用户评论(评分),以确定更好的旅游目的地,同时制定出游路线。旅游景点推荐的研究已取得一定进展,但仍存在数据稀疏、未考虑用户隐性偏好、未深入挖掘景点图像的潜在语义等问题。提出采用分层抽样统计模型获取用户偏好,改进贝叶斯个性化排序(Bayesian Personalized Ranking,简称BPR)及视觉贝叶斯个性化排序(Visual
在超大规模集成电路(Very Large Scale Integration,以下简称VLSI)物理设计中,布局问题将模块放置在一个给定的区域内,在满足模块间不互相重叠的基础上,优化一些相关指标(如
利用语音障碍进行帕金森病检测是目前帕金森病早期诊断的研究热点之一。近年来基于深度学习的语音障碍检测发展迅速,且检测正确率高。由于深度学习固有的特点,使得通过深度学习网络自动学习的语音特征在医学上可解释性较差。针对这一问题该文提出研究帕金森病语音传统特征梅尔频率倒谱系数和语音深度学习特征间的关系。主要使用偏最小二乘法、多任务Lasso(Least absolute shrinkage and sel
超密异构网络(heterogeneous ultra dense network,H-UDN)是在传统的宏基站覆盖范围内密集地部署一层小基站实现无缝覆盖,通过缩短用户与基站之间的距离来提升用户的速率,拥有着处理海量(1000倍)无线数据流量的能力,被认为是实现5G及未来网络的关键技术。然而,随着小基站数量飞速增加,小基站与宏基站之间的回程负担急剧加重,致使回程传输成为了H-UDN性能提升的瓶颈。无
多能体系统的分布式协同控制中每个智能体都能与相邻的智能体进行通信,使得多智能体系统的整体效率和运行能力都有所提高。由于其广泛的实际应用以及低成本、高自适应、易于维护等优点,引起了众多研究者的关注。已有文献大都考虑一阶、二阶或高阶线性动力学的多智能体系统,然而实际物理系统具有复杂的非线性特性,因此研究高阶非线性多智能体系统的一致问题具有重要意义。随着研究的深入和实际需要,对多智能体的性能也提出了新的
柔性集成电路基板(Flexible Integrated Circuit Substrate,FICS),简称柔性基板,是一种未封装电子器件的电路板裸板,是电子设备的核心组件之一,其质量检测极其重要。随着电子
作为传统多输入多输出(multiple-input multiple-output,MIMO)技术的一种扩展,在基站(base station,BS)端配置成百上千根天线的大规模MIMO能有效提高系统容量。为了受益于大规模MIMO技术带来的优势,需要获取准确的信道统计信息(statistical channel state information,S-CSI)。由于天线尺寸变大及散射体生灭过程,大
风力机叶片大多数为玻璃纤维环氧树脂复合材料(Glass Fiber Reinforced Plastic,简称GFRP),是风力机获取风能的关键部件。在叶片的生产过程中,往往因为其制作工艺的特殊,自动