数字视频自适应稳像研究

来源 :华北电力大学(北京) | 被引量 : 0次 | 上传用户:asa333
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着人工智能的发展,视频在日常生活、工业发展、智慧医疗等领域发挥着越来越重要的作用。然而,在拍摄过程中由于各种原因使拍摄的画面发生不稳定的现象,这样不仅会给视频的观看者造成不良的观影体验,还会影响后续视频图像的分析处理及识别过程。因此,数字稳像方法研究具有重要的应用价值。对于运动状态复杂的视频抖动,为了得到更好的运动估计模型,以及获取合适的滤波轨迹,保证视频稳像效果,本文主要做了以下几个方面的工作内容:(1)本文首先对数字视频稳像算法的流程及当前常用的评价方法进行了详细的阐述,并对国内外数字视频稳像算法进行了研究现状总结,其中包括2D算法、3D算法以及新兴的2.5D算法,分析了目前数字稳像算法所存在的一些技术难点。(2)本文提出了基于多路径优化的视频稳像算法。运动估计阶段在传统方法基础上将视频画面划分成均匀子块并分别进行机器学习的FAST特征点提取以及KLT算法跟踪,分别计算各个子块的运动轨迹;在运动平滑阶段,通过改进的加入自适应调节参数的能量函数进行多路径的优化,能够根据当前运动状态得到最优的全局平滑轨迹,并通过补偿得到最终稳像视频。(3)本文提出了基于改进自适应Kalman滤波的数字视频稳像算法。在运动估计阶段,将加入距离约束的Shi-Tomasi角点与金字塔光流法相结合计算得到运动轨迹;在运动平滑过程中,对传统Kalman滤波算法进行改进,加入偏差概率分布自适应调整参数来进行实时跟踪,最后进行运动补偿得到稳像视频。针对不同场景、不同类别以及不同运动状态下的抖动视频分别进行大量的计算机仿真实验,并与当前一些应用广泛、效果较好的稳像方法进行对比。实验结果表明,本文方法具有较好的稳像效果。
其他文献
从自然场景获取的图像中读取文本,也被称为场景文本识别,是一项具有挑战性的计算机视觉任务。然而,场景文本识别模型的训练需要采用大型的训练集,训练集的体量和复杂性增加不可避免的带来了样本噪音的问题。样本噪音可降低场景文本识别模型的识别准确率从而影响模型的可用性,精心制作的少量的样本噪音就可对模型的可用性造成不可忽视的破坏。这种利用样本噪音对模型完整性、可用性造成破坏的攻击方法被称为数据投毒攻击。目前对
随着区块链技术的日益成熟,越来越多的系统以区块链为底层架构。而日益增多的物联网设备也产生了大量的数据。毫无疑问,这些数据被协同处理并共享后将产生更大的数据价值。考虑到这些数据分属不同的实体或个人,所以用安全多方计算来设计数据处理共享方案能很好的兼顾数据安全和隐私保护这两点要求。本文围绕区块链和安全多方计算技术展开相关研究。以区块链为基础,本文分别从横向并列的三个不同的角度进行研究:安全多方统计计算
单图像超分辨率重建是计算机视觉领域经典问题,旨在从一个给定的低分辨率图像中恢复出高分辨率图像。近年来,基于深度卷积神经网络的图像超分辨率技术取得了突出进展,许多有效方法相继被提出。但是,当前大多数方法通过简单堆叠残差块方式增加网络深度,虽然提升了网络性能,但是不可避免引入大量参数,限制了在移动或嵌入式等资源受限设备中的使用。本文提出了一种轻量级嵌套残差超分辨率网络,旨在构建一种参数量少、视觉效果良
对隐私数据保护在当今愈发重要。安全多方计算主要应用于隐私数据的联合计算,在保证隐私的前提下发掘数据的价值。安全多方计算提供了多方参与联合计算的解决方案,可以实现在不暴露隐私数据的前提下得到约定函数的结果。安全多方计算技术在电子投票方案的设计中发挥着重要作用。利用安全多方计算技术的安全电子投票方案可以有效的避免信息泄露的情况发生。基于安全多方计算的电子投票方案在具体实现中涉及很多相关领域的技术,包括
制定替代能源政策的必要性是因为人们认识到化石燃料也并不是无穷无尽的,并且对环境有着非常严重的危害。因此,在过去的几十年中,科学界一直致力于能够使用和转换可再生能源,特别是利用太阳辐射的系统。如今,使用太阳能集热系统作为供热来源的发电站相较于无储能系统的光伏电站,具有稳定性更高的优势,而且与有储能光伏电站相比具有储能成本低,使用周期长的优点。由于吸收器表面能流密度分布受到很多种因素的影响,而且能流密
近年来,以深度学习为代表的人工智能技术取得了快速发展和广泛应用。然而,在实际应用中,人工智能的性能还是依赖于大量的标签数据,模型泛化性能不高。因此,如何减缓对标签数据的依赖并提升模型泛化性能是目前人工智能领域亟待解决的问题。领域自适应(Domain Adaptation,DA)就是该问题较好的解决手段,其旨在利用来自源域的知识帮助在新且相关的目标域上的学习。本文从损失函数、学习框架以及网络结构三个
在能源结构向低碳化转型的关键阶段,为尽快实现“碳中和”,有必要对清洁燃料火焰进行深入研究从而明晰其燃烧特性。本文系统综述了气态和生物质燃料火焰的检测方法以及火焰电学特性研究的发展动态,在实验室规模的燃烧设备上开展了甲烷和生物质燃烧实验,并基于图像和静电信号分析了火焰的形态特征和电学特性,为全面了解清洁燃料燃烧特性提供了参考。本课题的主要工作内容如下:本研究使用非侵入式静电传感器阵列测量不同种类火焰
图像去噪、图像融合一直是数字图像处理领域的研究热点问题。近年来,分数阶小波变换成为了一种新的信号处理方法,其定义基于小波变换和分数阶傅里叶变换。它将多分辨率分析推广到时域-分数阶频域,成为一种新的时频域分析方法。因此,将分数阶小波变换应用到图像去噪、图像融合领域具有非常广阔的发展前景。本文的主要研究工作如下:(1)在图像去噪方面传统的阈值函数去噪主要是硬阈值函数去噪和软阈值函数去噪,但是这些阈值函
多聚焦图像融合是图像处理领域的一个热点问题。近年来,随着深度学习技术的发展,卷积神经网络在多聚焦图像融合中的应用也越来越来越广泛。大部分基于卷积神经网络的多聚焦图像融合方法主要思路在于,将多聚焦图像融合的问题转化为区分聚焦像素和离焦像素的二分类问题,然后通过训练一个可以判别像素聚焦水平的卷积神经网络来产生决策图,最终在决策图的引导下完成多聚焦图像融合。然而,这些多聚焦图像融合方法仍然面临着一些不足
自1895年,X射线被伦琴发现以来,计算机断层扫描(Computed Tomography,CT)已经逐渐发展成为一项非常成熟的无损检测技术,它具有无损、高时空分辨率和三维可视化等优点。随着X射线CT技术的快速发展,应用领域不断扩大,对重建图像的质量要求也越来越高。提高图像的质量不仅需要高精度的CT扫描系统,还需要优质的图像重建算法。此外,CT扫描带来的辐射剂量过高的问题也引起了人们广泛的关注。因