基于语义标注的视频相关反馈检索系统

来源 :北京交通大学 | 被引量 : 0次 | 上传用户:wlck_dong
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
自上个世纪九十年代以来,基于内容的视频检索便成为一个热门的研究课题。在信息爆炸的今天,如何使用计算机自动挖掘视频中的语义信息,并有效地利用高层特征进行视频检索,已经成为多媒体研究领域中一个亟待解决的问题。视频语义表示的优势在于与人的认知理解相符合,是一种解决低层特征与高层语义之间语义鸿沟问题的有效途径。本文提出一种基于视频语义的检索方法,该方法利用已经获得的视频语义标注信息,使用一种具有长期学习记忆性的相关反馈方法对视频语义进行查询。相关反馈是一种借助人机交互来提高检索精度的方法,本文讨论并实现了一种基于支持向量机的相关反馈方法:用户在一轮检索结果中选择符合查询目的的关键帧作为正例样本,系统根据正例样本数量以及检索的排序信息选择负例样本,这两类样本构成SVM的训练集,学习得到SVM模型后,使用该模型作为新一轮检索的分类器。由于用户反馈得到的训练集往往是一个小样本集,根据经验,利用小样本集训练得到的SVM模型通常能够取得优秀的分类效果。另外,为提高SVM的训练速度,本文在SVM训练过程中采用了一种快速算法Sequential MinimalOptimization,简称SMO算法。相关反馈是提高检索准确度的有效手段,但一般的相关反馈系统的缺点是无法对用户的反馈信息进行长期保留,是一种短期记忆学习机制。而且基于视频低层特征的相关反馈检索仍然深受语义鸿沟的影响。为建立视频语义检索系统,并使其相关反馈操作具有长期学习记忆性,本文使用语义标注信息构造一个低维的视频语义特征,以此为基础建立一个关键帧与语义概念的关联网,通过用户的相关反馈操作对关联网进行具有长期记忆功能的更新,最终的查询结果即关联网中与查询概念相关程度较高的关键帧。本文提出的检索方法,具有长期记忆性,系统的检索精度能够通过知识积累不断得到提高;此外,由于检索是基于语义特征的,能更好地理解用户的查询意图,取得了较好的实验效果。
其他文献
纸张计数是工业生产中很常见的操作。传统的纸张计数是由专门的计数装置来完成,其成本高、体积大、易于产生错误的缺点很明显,迫切需要改进。本论文从纹理图像分析的角度来进
当前信息技术的发展和应用趋势呈现出两个主要特征:一方面,系统功能性的不断增强使得计算环境正在变得日趋复杂;另一方面,无处不在的计算使得今天的用户日趋大众化。今天企事
随着数据处理领域研究的不断深入和研究内容的不断发展,研究者们逐步发现数据需要以流的形式处理。这些数据传输速度快、规模大、传输持续时间长,并且只能被有限的读取几次。
矿井水害一直是威胁我国煤矿安全生产的重大隐患,对矿井水文状态进行实时监测和及时发布,是提高煤矿安全生产的有效手段。本文根据计算机软、硬件和网络应用快速发展的现状和
无线网络MAC协议可以协调用户公平的使用无线信道资源,实现数据的可靠传输,能够很大程度上影响无线网络的性能。传统无线网络MAC协议基本上都是单信道协议,这种技术会导致整
在石油钻井过程中,井壁失稳问题是一个需要解决的重大技术难题。对于石油钻井工程来说,井壁失稳会引起井壁坍塌,甚至导致井眼报废;井壁失稳还会影响固井质量以及油井生产,造成严重
SOA(Service Oriented Architecture,面向服务的架构)作为一种新的软件架构,已经逐渐显示出其优越性。它主要是在多种现有技术的基础之上构建一个灵活并且可扩展的框架,这些
路径测试数据生成是软件测试领域研究的热点问题之一。自动生成路径测试数据对提高路径测试的效率、降低软件测试成本、保证软件质量有着重要的意义。本文采用粒子群优化算法
随着数据存储的高速增长,传统的数据库已经无法满足人们处理大规模数据的需求,有关海量数据的处理与存储成为当前的研究热点。Hadoop文件系统HDFS成为研究云存储应用的参考模
随着互联网和信息技术的快速发展,企业在运营过程中会产生大规模的数据,并且数据已成为重要的资产。但这些大规模数据呈现的是不完全的、有噪声的、模糊的、随机的状态,具有规模