面向微视频的场景识别关键问题研究

来源 :山东大学 | 被引量 : 0次 | 上传用户：jianjian9527

【摘要】

：

微视频又称为视频分享短片,是指互联网用户通过手机、电脑、摄像机等多种摄录设备拍摄并自主上传的视频短片。近年来随着社交媒体的迅猛发展,微视频这种新的媒体形式已成为当

【作者】

：

郭杰

【出处】

：

山东大学

【发表日期】

：

2004年期

【关键词】

：

微视频理解场景识别多模态融合深度学习模态增强

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

微视频又称为视频分享短片,是指互联网用户通过手机、电脑、摄像机等多种摄录设备拍摄并自主上传的视频短片。近年来随着社交媒体的迅猛发展,微视频这种新的媒体形式已成为当前媒体结构的重要组成部分,对人们的生活产生了重要影响。场景识别是对图像或视频场景语义的分析与理解,是计算机视觉的重要研究内容。虽然场景识别的研究起源已久,也取得了较大的研究进展,但是面向微视频的场景识别是相对较新的研究课题。研究面向微视频的场景识别有助于挖掘微视频内在使用价值,可为微视频相关产业提供技术和方法支撑。因此,研究面向微视频的场景识别具有重要的科学意义和很高的应用价值。与传统场景识别任务相比,面向微视频的场景识别具有自身的特性:1)数据量大。微视频多来自社交媒体平台,而数以亿计的社交媒体平台用户,产生了海量的微视频数据,可以为场景识别提供数据支持。2)时长短。微视频的时长短则几秒,长则不超过二十分钟,时长短使得微视频场景信息较难捕捉,这在一定程度上增加了微视频场景识别的难度。3)具有社交属性。大量的评论、话题等社交属性中包含的文字信息,可以作为微视频的模态之一,为微视频场景识别提供更多辅助。上述特性,使得面向微视频的场景识别具有较大的研究空间。同时,面向微视频的场景识别也面临诸多挑战:1)噪声问题。微视频的生成,由于没有相应的标准和规则,导致其主观性较强,数据中往往包含很多噪声。2)不同模态之间关联性较弱的问题。微视频的视觉、声音、文字(来源于评论、话题等社交属性信息)可以作为微视频场景的多个模态表示,但是微视频的来源以及拍摄上传的随意性导致了微视频视觉、声音以及文字三个模态之间的关联性较弱。3)不一致性问题。对同一场景、相同的表达意图,不同用户拍摄的微视频,内容上经常存在较大的差异。4)部分模态对场景语义表征能力弱的问题。由于客观噪声或用户的主观性,导致部分视觉、声音或文字信息对视频场景语义表征能力较弱,很难通过单一模态确定场景类别。5)数据不平衡问题。热门场景,数据量很大,冷门场景,数据量可能很小。本文基于面向微视频场景识别的特性,针对上述部分挑战性问题,重点开展了如下研究工作:1)针对微视频场景的不同模态之间关联性较弱的问题,本文提出了基于多模态互补的微视频场景检索方法。该方法充分利用多个模态的语义互补性,将多个模态融合成一个特征表示,进而通过多层感知机将该融合特征进行非线性变换,来自动学习每一维特征与场景语义的相关性。最后通过监督的哈希学习方法,学习既保持了类内相似性又具有判别性的哈希码表示,提高了场景检索效率和精度。2)针对同一场景下微视频内容存在不一致性的问题,本文提出了基于一致性语义学习的微视频场景分类方法。该方法采用场景的深度特征作为空间特征表示,并将注意力机制融入特征表示来自动提取视频帧中与场景语义相关的内容。结合长短时记忆模型LSTM,学习视频帧之间蕴含的时序特征。最后通过双分支的网络框架和监督的学习机制,学习同一场景下视频内容的一致性特征表示,提升了微视频场景分类的准确率。3)针对微视频场景的部分模态语义表征能力弱的问题,本文提出了基于多模态语义增强的微视频场景分类方法。该方法通过最小化多个模态语义之间的距离,实现强语义模态对弱语义模态的语义增强。同时将增强后的弱语义模态特征与增强前的特征表示相融合,充分利用了弱语义模态自身的特性。最后通过多个模态的特征权重自动学习,实现自适应的多模态互补融合,提升了微视频场景分类的准确率。

其他文献

家属参与式个案管理在急性心肌梗死PCI患者心脏康复中的应用研究

目的探讨家属参与式个案管理在急性心肌梗死介入术后患者心脏康复中的应用效果;评价家属参与式个案管理护理模式对急性心肌梗死介入术后患者心脏康复依从性及生活质量的影响

学位

急性心肌梗死家属参与式个案管理心脏康复生活质量

复方槐米抗氧化剂抗氧化作用研究

研究了槐米、甘草提取物复配抗氧化剂对DPPH自由基的清除作用和对邻苯三酚自氧化的抑制作用，以及在月饼和香肠中的抗氧化应用。结果表明，复方槐米抗氧化剂在月饼中的最佳配比为

期刊

槐米甘草复方抗氧化剂抗氧化sophora japonica liquorice compound antioxidant anti-oxidation.

基于山地生态修复的郊野公园规划设计探索

面对当前人居环境标准不断提升、山地生态环境胁迫严重等形式,位于城郊的山地郊野公园在调控山地生态环境、服务城市居民等方面扮演着越来越重要的作用。该文在阅读大量文献

学位

郊野公园山体生态修复生态敏感性华北地区

SP-A、TNF-α、GDF-15在AECOPD患者诊断价值的研究

目的:检测慢性阻塞性肺疾病患者急性加重期(包括A1期、A2期)及病情缓解期血清中肺表面活性蛋白-A、肿瘤坏死因子-α、生长分化因子-15的表达水平,探讨其临床意义,为预测AECOPD寻找有效的血清生物学指标。方法:(1)收集慢性阻塞性肺疾病急性加重期患者60例(加重组),其中肺功能分级为Ⅰ级、Ⅱ级患者30例(A1组),肺功能分级为Ⅲ级、Ⅳ级患者30例(A2组)和病情缓解期患者30例(缓解组)。(2

学位

慢性阻塞性肺疾病慢性阻塞性肺疾病急性加重期肺表面活性蛋白-A肿瘤坏死因子-α生长分化因子-15诊断

设施甜瓜和番茄全有机营养肥水耦合效应研究

随着人们生活水平的不断提高,对食品安全问题愈发重视,优质高产的有机农产品被消费者所青睐,具有很大的市场潜力。大量研究发现有机栽培的蔬菜品质好、口感浓郁、营养价值高

学位

基质栽培有机营养液品质产量养分利用率

基于层次分析法的智能垃圾分类回收效益影响因素研究

在垃圾分类回收现状分析的基础上,运用层次分析法对居民垃圾分类的意识、居民垃圾分类积极性、政府部门的参与程度、垃圾分类回收的成本四类影响因素建立了智能垃圾分类回收

期刊

智能垃圾分类回收层次分析法经济效益intelligent garbage classification and recoveryanalytic hier

金属含量对Co-TiO2纳米颗粒复合薄膜微观结构及其性能的影响

目的使Co-TiO2纳米颗粒复合薄膜同时具备高的磁化强度及电阻率,从而实现更好的高频软磁特性。方法通过磁控共溅射的方法,在不同金属靶功率下制备了Co-TiO2纳米颗粒复合薄膜,

期刊

纳米颗粒复合薄膜COTIO2磁学电学高频软磁特性nano-particle composite filmCoTiO2magnetic propert

面向微视频的场景识别关键问题研究

其他学术论文