论文部分内容阅读
在多媒体信息技术发展迅猛的大数据时代,社会发展受到技术变革的巨大影响,人类生活也产生了明显的变化。海量多媒体数据在应用中体现出难以分析、查找和处理等问题,目前的主要检索方法仍然需要依靠人力并消耗大量的时间来处理完成。为了解决上述问题,达到智能和精确的检索目的,专家学者们从内容检索向语义检索逐步推进,并已进行基于对象、行为和事件语义检索等方面的研究。基于语义特征的提取方法与其相关技术的研究是解决语义检索中存在问题的关键。为了更好解决上述问题,需要处理海量视频中存在的大量冗余。通过计算多个MPEG-7描述子组成的特征向量间的距离得到帧间相异性,从而提出了一种基于聚类的冗余帧去除改进算法RRFC (Remove Redundant Frame based on Clustering)。该算法有效地保持了视频帧序列的时序性和视频主要内容的完整性,为后续步骤减小了数据规模和计算量。基于视频图像低层特征提取的研究现状,从颜色、纹理、形状和空间关系等特征以及随机抽样方面进行了分类和分析。根据红外摄影图像的应用需求,提出了一种基于高斯滤波和拉普拉斯边缘增强的图像边缘特征提取算法FEIED (Filtered and Enhanced Image Edge Detection),并以硫系玻璃的缺陷检测为实例进行了实验验证。去除冗余之后减小了数据规模,便于进行视频关键帧的提取。其方法包括特征提取、镜头分割、子镜头分割和关键帧提取四个步骤。特征提取同样采用了MPEG-7描述子的方法计算帧差。镜头分割采用了经典的双阈值分割方法。子镜头是内容更加一致的镜头片段,在子镜头上提取关键帧更能体现视频的主要内容。基于滑动窗口的子镜头分割方法SBDW (Sub shot Boundary Detection based on sliding Window)可以有效地保持视频帧序列的时序性,并将多类问题转化为多个二类问题,减少了时间复杂度和计算量。同时,基于图论的关键帧提取算法KFES (Key Frame Extraction based on Sub shot)可将关键帧提取转化为图的顶点覆盖问题。在此前研究成果的基础上,进一步研究学习视频语义提取的相关方法,并提出了一种基于条件随机域的视频语义特征提取方法,包括参数估计算法MPE (Model Parameter Estimation)和更新算法MR (Model Replace)。该方法可以实现视频语义特征概念本体的自动提取和标注,从而提供语义检索的可行性。针对视频图像检索应用需求的研究可从视频语义特征提取的若干关键问题入手进行研究,提出若干创新性成果。若要满足日益增长的视频图像检索需求,则要构建更高效的语义检索框架来提供包括对象、行为、场景、事件等更为精确的语义描述。