面向视频内容的草图摘要方法及交互技术研究

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:daren19112879
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着软硬件以及网络技术的发展,视频数据在近几年呈现出爆炸式的增长,在人们的日常生活中占据越来越重要的地位,视频逐渐成为人们进行信息交流的重要载体。随着视频资源的急剧增加,如何有效地利用视频信息具有巨大的应用价值。但视频高层语义难以提取以及现有的视频交互方式单一、组织繁杂是影响视频应用发展的一个瓶颈问题,如何更加高效地浏览和定位视频已经成为现在的研究热点。同时,视频底层物理特征的处理与面向高层语义特征的用户需求之间存在难以跨越的语义鸿沟,通过已有视频底层处理技术很难得到基于视频内容的语义信息,使得自动识别视频高层语义也存在很大的难度。   为平衡由视频高层语义提取所带来的难度,研究者通过生成视频摘要与添加视频注释等方法来辅助用户对视频语义的理解以及进行后续的视频管理、浏览和定位等操作。视频数量的大幅度增加和人机交互技术的飞速发展促使视频用户不再只是被动接受视频内容信息,而是希望参加到主动编辑视频内容并进行交互的任务中去。然而,传统的交互方式是基于WIMP交互范式,在菜单选择、键盘输入以及按钮等操作之间频繁转换,影响了用户交互的连贯性以及思维的连续性。   草图技术不仅可以用于描述具体事物,也可以用于描述其它媒介难以描述的抽象信息,因而本文提出了视频语义的草图描述模型,针对当前视频内容可视化技术中存在的问题提出了一种面向视频内容的草图摘要的生成方法,并在此基础上将生成的草图摘要作为视频交互的界面,以解决视频应用中交互方式单一,操作繁琐的问题。   本文主要工作包括:   (1)分析了草图的描述能力,在分析视频语义特征的基础上,使用草图作为用户与视频低层特征及高层语义之间的中间媒介,提出了视频语义的草图描述模型;   (2)提出了一种面向视频内容的草图摘要生成方法,该方法通过视频内容分析获得视频语义特征,并通过语义特征辅助草图生成,最终进行摘要布局,构建出草图形式的视频摘要;   (3)分析了用户交互任务,采用草图做为交互媒介,通过手势命令来控制交互行为,用户通过自定义的草图注释来辅助理解视频内容,结合视频的多尺度浏览来达到自然、顺畅的交互;   (4)在上述研究的基础上,设计并开发了面向视频内容的草图摘要生成与交互的原型系统,并通过用户评估实验,实验结果证明该系统具有优于已有方法的易用性,取得了良好的效果。
其他文献
炭黑是许多烃类物质经过不完全燃烧或裂解生成的超细的烟炱,被广泛应用作橡胶,涂料和油墨等工业等的基本原料,也是橡胶制品的重要补强材料和填充材料。全球范围内对炭黑的需求量
数据加密是网络信息安全的重要组成部分,AES算法是由美国国家标准与技术研究院(NIST)选定的新一代数据加密标准。作为目前最优秀的对称加密算法,其应用已深入各个安全领域,针对A
如今随着互联网规模急剧增长,科技文献电子资源数目也成倍的膨胀着,用户查找信息犹如大海捞针,“信息过载”和“资源迷向”问题制约着人们高效使用科技文献的能力。全文检索工具
随着软件不断向服务化、平台化的方向发展,越来越多的软件系统采用开放可编程接口的方式对外提供功能,使得第三方用户可通过标准的协议在线访问、集成平台功能,构建各类新型应用
计算机集群技术作为搭建高伸缩性与高可用性系统的最成熟的解决方案之一,受到学术界和工业界的密切关注与认可。集群移植作为快速搭建集群的一种方法,可以将单机模式的系统通过
图像中的显著区域是指图像中某些区域与其周围区域明显不同,同时能吸引人眼注意的区域。图像显著性检测的目的是利用计算机模拟人眼视觉系统自动检测出图像中的显著区域,图像显
随着人机交互技术和计算机视觉技术的不断发展,体感交互逐渐成为人机交互领域重要的研究热点之一。特别是微软的体感交互设备Kinect,加速了体感交互技术的研究进程。另一方面,大
随着信息时代的到来和信息化技术的快速发展,船舶信息系统中各应用系统之间便捷、高效的数据分发、处理、备份也显得日益重要。针对船舶信息系统日益复杂,系统对实时性、可靠性
实时系统是一类需要在规定的时间内响应外部事件并完成对外部事件处理的系统,这类系统常见于与生命财产密切相关的领域,一旦这类系统出现设计上的缺陷,将会导致非常严重的后果,因
在软件测试中,对于特定的软件而言,我们不仅要考虑单个因素对软件运行产生的影响,也要考虑各个因素之间的交互对软件正常运行产生的影响。   组合测试是一种黑盒测试方法,其目