基于视频流的目标检测与行为识别研究

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:dffder
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
视频处理技术的快速发展是当今社会走向人工智能时代的一个重要产物,对视频中目标的检测和人类活动的理解也受到研究的关注。传统视频任务处理需要人为构造特征模型,但随着任务的逐渐复杂,特征的构造也愈发困难,且计算成本越来越高。本文针对视频目标检测与视频行为识别分别设计具体的网络结构,提高网络的检测效率和实用性。对于视频目标检测,提出一种基于全局视觉分析的视频目标检测算法,在原有流引导特征聚合算法思路基础上,更关注寻找检测精度与运行时间之间的折衷策略。首先利用全局视觉分析的思想,使用感知哈希算法在多帧特征聚合前进行帧段两端的全局视觉相似度计算,判断当前局部帧段的图像信息相关性;其次使用连续帧作为输入,进一步利用视频的前后时序信息,将相邻帧在运动路径上的特征聚合到当前帧的特征中,进而对视频特征有更好的表达。在Image VID数据集实验表明,经过全局视觉分析处理后的特征聚合算法在视频中进行目标检测的准确率和速度均得到一定提升。对于视频行为识别,提出了一种融合注意力机制的视频胶囊网络。在视频胶囊网络基础上嵌入适应胶囊网络的注意力机制“挤压-激励”模块,通过对胶囊类型之间的相互依赖性建模,增强整个网络捕获动作类型的能力,进而提高网络的性能。该网络可以对胶囊特征不同类型对胶囊类型赋予注意力权重,使其通过学习全局信息来有选择地强调有效的信息特征或抑制不太有用的特征。对UCF-101(24类)、J-HMDB和UCF-Sports行为识别数据集进行实验,结果表明该方法在这些数据集上取得了目前较好的性能。通过对附加参数的实验探究表明设计是一种轻量化的选通机构,能够有效地模拟胶囊类型之间的关系,此外分析注意力机制的应用对行为识别效果的提升作用,验证方法的有效性。
其他文献
近年来,随着医患纠纷的不断产生,看病难、看病贵问题日益突出,以及新医疗改革方案的公布,医疗改革再次受到重视。本文从医疗体制改革过程中存在的医疗保障制度不健全、卫生资
当前我国正处于会主义现代化建设的转型时期,各种矛盾激化,社会不稳定因素增多,因仇恨动机引发的犯罪就是其中之一。然而,仇恨犯罪在我国并没有得到应有的重视,关于仇恨犯罪的研究
变动成本法与完全成本法是管理会计中的两种成本核算方法,这两种方法由于对成本的核算标准不同,在产品成本、存货计价、税前利润等方面都存在差异。本文就变动成本法与完全成
云计算作为向用户提供从物理资源到计算服务等虚拟资源的商业计算模型,其对大容量存储和高性能处理能力地追求一直是趋使云计算发展的关键动力之一。业界巨头如Google, Amazo
主要阐述重庆菜园坝长江大桥4200kN缆索吊机设计过程,主要包括缆索吊机总体设计、缆索系统、缆索吊机塔架和扣索塔架、锚碇、缆风系统、起重牵引系统设计等。
专业技能型社团是高职院校开展第二课堂教育教学的重要载体,是学生锻炼专业技能、提升职业素养、丰富校园文化的重要平台。本文以专业技能型社团为视角,以“爱心维修社”为典型
京津冀协同发展已上升为国家战略,而作为三极之一的河北省则成为京津冀发展中的短板,本文通过对形成这种现象的原因,以及今后京津冀协同发展中几个重点制约因素进行分析,提出
目的:对中药复方小续命汤石油醚总提取物中的成分及有效成分进行鉴定。方法:在进行生物活性研究的基础上,采用 GC 和 GC-MS 法对中药复方小续命汤中的脂溶性成分进行了分离鉴
京沪高速铁路镇江京杭运河特大桥主桥上部结构为(90m+180m+90m)预应力混凝土连续梁与钢管混凝土拱组合结构,是目前世界上跨度最大的无砟轨道桥梁,着重阐述施工中的关键技术。
<正>皮肤疾病在肉鸭养殖生产中时有发生,患鸭的主要症状是皮肤变色、坏死等,严重影响鸭肉品质,造成肉鸭养殖的经济效益下降。2017年夏季,由于持续高温,导致山东省滨州市某鸭