视听相关的多模态概念检测

来源 :计算机研究与发展 | 被引量 : 2次 | 上传用户:jinr0op8
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着在线视频应用的流行,互联网上的视频数量快速增长.面对互联网上海量的视频,人们对视频检索的要求也越来越精细化.如何按照合适的语义概念对视频进行组织和管理,从而帮助用户更高效、更准确地获取所需视频,成为亟待解决的问题.在大量的应用场景下,需要声音和视觉同时出现才能确定某个视频事件.因此,提出具有视听信息的多模态概念的检测工作.首先,以名词-动词二元组的形式定义多模态概念,其中名词表达了视觉信息,动词表达了听觉信息,且名词和动词具有语义相关性,共同表达语义概念所描述的事件.其次,利用卷积神经网络,以多
其他文献
为指导玉米地膜盖栽培,从土地整理、种子的处理、播种时间、地膜覆盖方式及出苗管理等方面介绍了玉米地膜盖栽培技术。
介绍了免棱镜全站仪的工作原理及优缺点,对Leica TS06全站仪在无反射棱镜条件下的测距性能进行了测试,得出了测距边长、测量目标的属性对免棱镜测距的影响关系,介绍了免棱镜全站仪在工程项目测量中的应用实例。
广西某金矿通过进行摇床重选和浮选两种选别工艺对比试验研究发现,采用浮选工艺金回收率明显高于摇床重选。浮选采用硫酸调节矿浆后,采用丁黄药+丁铵黑药作为组合捕收剂,闭路
指出了目前WebGIS存在的不足,结合Web Services技术,提出了一种基于Web Services的GIS互操作模型,该模型在设计时遵循OGC和ISO/TC211服务规范,使得不同的GIS数据和GIS功能实
随着云计算的快速发展和大数据时代的到来,如何将一些耗时的计算任务安全地外包给不完全可信的公共云服务器引起了广泛关注.基于单服务器模型,提出了一个新的具有隐私保护的