视频分割关键技术研究

来源 :中国科学院自动化研究所 | 被引量 : 0次 | 上传用户:yanjie99826
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息和多媒体技术的不断发展及数字化进程的加快,以图像、声音和视频为主的多媒体信息日渐成为信息交流与服务的主流。如何有效的管理和利用如此庞大的多媒体数据资源,以及从这些海量的多媒体数据中快速找到用户需要的数据和资源,是当前基于内容的检索系统中需要解决的问题之一。   新一代视频编码技术使视频拥有更高的质量,却占用更小的存储空间。在当前视频编解码和处理系统中,运动估计技术对降低视频序列时间冗余度、提高编码效率起着非常关键的作用。由于运动估计占用整个编码器编码时间的60%-80%,运动估计算法的复杂性将直接决定视频压缩编码系统的复杂性。   本文对视频结构化中的镜头边界检测技术和视频编码中的快速块匹配运动估计技术进行了深入的研究和探讨。本论文的创新点及主要成果如下:   1.提出了一种基于时空切片分析的镜头边界检测算法。视频数据量大,通常的解压缩域上的检测方法速度慢,不利于实际应用。为了提高检测速度,本文将镜头边界检测转换为时空切片梯度图上的直线检测,再利用图像处理中的哈夫变换将直线检测转换为哈夫参数空间上的极值点检测问题。实验结果表明,该方法检测速度快,对于运动有较好的抑制作用。   2.提出了一种基于投影时空切片运动估计的镜头边界检测算法。由于传统的时空切片容易造成误检,本文提出并使用了一种新的时空切片——投影时空切片。与原有的时空切片相比,投影时空切片对于运动不敏感。在此算法中,还提出了一种与阈值无关的初检方法和对于初检结果进行交叉验证的方法和评分策略,最后根据各个可能点的评分进行3-Pass检测。实验结果表明,对于不同视频类型,本算法均有较好的检测性能,尤其是对于突变的检测(无论是否存在剧烈运动),取得了非常高的召回率和很高的准确率(都保持在97%以上),在准确率和召回率之间保持了很好的平衡。与其他算法相比,本算法在具有较好性能的同时,计算复杂度低、检测速度快。   3.提出了一种基于正交分布模型的快速块匹配整像素运动估计搜索算法。首先本文对最佳运动矢量的分布进行了统计,发现运动矢量除了具有已知的中心偏移(center-biased)的特性之外,还具有一个非常明显的特性——沿正交轴轴向分布。依据运动矢量分布的这两个特性,本文设计了与之相适应的搜索模板和搜索策略。实验结果表明,与钻石搜索和六边形搜索算法相比,该算法可以通过更少的搜索点找到相同的最佳匹配点,搜索速度分别提高了40%和20%。   4.设计并实现了一个通用的线程安全的视频解码器。该解码器支持所有的文件格式,提供一致的调用接口。性能测试表明该视频解码器具有很高的解码速度,有较好的实际应用价值。
其他文献
本文设计研制了一种四足两栖仿生机器人,提出了新的水陆两栖运动控制策略。该两栖机器人能够在复杂多变的水陆环境自主运动。文章首先介绍了两栖机器人的机械结构和控制系统,其
白酒生产是我国的传统产业,历史悠久,具有独特的传统工艺流程,但是这种工艺流程中由于主要以人工品尝的方法来进行勾兑调味,而口感具有个体差异,并受很多主客观因素影响,且理化指标
学位
扩散张量成像(DTI)是一种新型的磁共振成像技术。利用DTI技术,可以进行基于活体的大脑解剖连接和神经环路的研究,而且近年来被应用于大脑解剖网络的构建和分析,可以从全局角度来
学位
无陀螺微惯性测量系统具有抗高过载值冲击、体积小、成本低等优点,是当前捷联惯导系统发展的一个新方向;直接侧向力控制技术可以显著提高拦截导弹的响应速度,已被证明是实现精确
将水下机器人用于极地科考,可以通过其携带的多种传感器和设备进行大范围、长时间的冰下观测作业,并取得重要的极地科考资料,如冰下水纹,海冰厚度等。而这些观测数据必须与准确的
人脸识别的任务是使计算机具有根据人脸数据确定人身份的能力。通过对人脸数据进行处理和分析,提取能反映人身份的本质特征,从而建立特征到身份之间的联系。经过多年的发展,有多
学位
自来水厂水处理工艺中的加药凝絮是一道重要的工序,加药凝絮的效果将直接影响到出厂水质。准确地投加混凝剂可以有效地减轻过滤、消毒设备的负担,在保证满足出厂水浊度要求的前
有效预测土壤水分含量,是提高水资源利用率的一条有效途径。选择气温、湿度、光照、降雨量等气象因素来预测土壤水分的含量,可以不用埋设土壤水分传感器,使工作量和成本都大
本文在服务机器人研究的基础上设计并实现了一种迎宾服务机器人系统,该系统具有嵌入式结构、传感器阵列、语音识别与语音控制技术、无线数据通信技术等,能够完成自主移动、动作
电视全台网自动播出系统是针对电视台数字化、网络化播出实际需求而开发的一种计算机网络系统,它是计算机技术、自动控制技术高度结合的产物,包括了播出控制、播出表编辑、节