【摘 要】
:
数字视频是多媒体技术的一个重要传播途径,被广泛应用于社会的各行各业之中。如何让用户能够快速捕捉到视频的内容,从而决定是否需要继续观看是需要关注的问题。在这样的背景下,视频摘要技术应运产生。视频摘要是一种新的基于内容的视频压缩技术,它能有效地从视频中发现重要信息,消除冗余数据,是对视频内容的概括。近年来视频摘要技术有了很大的发展,但是如何生成高效、准确率高的视频摘要仍然在不断的探索中,本文围绕视频摘
论文部分内容阅读
数字视频是多媒体技术的一个重要传播途径,被广泛应用于社会的各行各业之中。如何让用户能够快速捕捉到视频的内容,从而决定是否需要继续观看是需要关注的问题。在这样的背景下,视频摘要技术应运产生。视频摘要是一种新的基于内容的视频压缩技术,它能有效地从视频中发现重要信息,消除冗余数据,是对视频内容的概括。近年来视频摘要技术有了很大的发展,但是如何生成高效、准确率高的视频摘要仍然在不断的探索中,本文围绕视频摘要生成技术展开研究,主要工作有:(1)提出了基于密度峰值聚类(DPC)的视频摘要生成算法(简称DPC算法)。首先,提取视频帧色调直方图的特征,应用DPC聚类对视频帧的色调直方图特征向量聚类,以聚类的结果为依据进行视频镜头切分。其次在关键帧提取阶段,选取离聚类中心最近的帧作为关键帧,同时用直方图相交法去除关键帧中的相似帧,生成视频摘要。实验表明,该方法得到了较好的视频摘要结果。(2)提出了基于T-DPC的视频摘要生成算法(简称T-DPC算法)。在DPC算法中加入视频帧的时间特性,提出了具有时间特性的密度峰值聚类算法,并将其应用于镜头切分中。在关键帧提取阶段,综合考虑了视频帧的信息熵和与聚类中心的相似程度来提取关键帧,并剔除相似帧。实验结果表明,该方法得到的视频摘要质量均高于对比算法。(3)提出了基于Fast Newman社团检测算法的视频摘要生成算法(简称FN算法)。该算法以视频帧作为网络节点,以帧与帧间的相似度作为连边的权重,构建全连接无向加权网络,利用Fast Newman算法进行社团检测,提取出每个社团中离节点度均值最近的帧作为关键帧。同时采用颜色特征与SURF特征双重去除相似帧,得到了理想的视频摘要。
其他文献
混合现实技术发展相对成熟,应用广泛。HoloLens混合现实眼镜作为混合现实代表设备之一,其空间映射技术通过使用SLAM和计算机视觉技术帮助用户完成空间定位、扫描和重建工作,然而其并未对反映真实空间物体表面形状的网格进行分割和识别,在混合现实应用中无法完成基于分割对象的高级语义交互。因此,本文提出基于HoloLens空间映射的三维场景分割和识别研究。利用HoloLens完成室内三维数据采集,制作数
一直以来,印刷品作为常见信息交流工具,广泛地应用于生产生活。但其极易被不法分子复制甚至篡改,对社会的知识产权安全和生产创新带来了极大的破坏。传统的数字水印技术是保护信息安全的一大措施,但应用范围有限,无法有效应对打印扫描攻击,同时还有透明性、嵌入容量较低的缺陷。如何开发出能够抵抗打印扫描攻击的水印算法成为社会研究热点。目前,变换域算法能够有效的解决这一现状,其中DWT变换后的LL分量具有较好的鲁棒
随着新一代信息技术的创新发展,袜业制造行业从传统的手工生产逐步向数字化、智能化和柔性化的方向转型,但在袜品反求生产领域尚处在传统的人工打样阶段。本文结合袜子制版文件特征与图像特征提取技术的发展现状,将三维立体袜品转换为正反面拼接的数字图像,对样板袜品进行图像采集、袜子制版文件反求、袜子制版文件二次设计等功能设计,研发一种数字化、自动化的袜子制版文件反求生成系统。本文的主要研究内容如下:(1)基于颜
随着我国移动端、互联网技术的飞速发展,屏幕内容图像(Screen content image,SCI)的主成数量越来越多。然而,在对SCI进行获取、传输和压缩等过程中易产生噪声干扰和图像失真,这种干扰和失真造成的图像质量下降难以被精准评估和预测。基于自然图像的评估SCI的视觉质量预测中不能起到有效作用,已成为制约SCI评估指标提高的关键问题。因此,对客观的屏幕内容图像质量评估方法进行高效分析和建立
图像显著物体检测的目的是识别出图像中最重要的物体区域,并将目标区域从背景中剥离出来。由于图像中的显著物体容易受到背景区域的干扰,使得图像显著物体检测非常具有挑战性,为了提高图像显著物体检测的性能,本文对图像显著物体检测算法进行了研究,提出两种图像显著物体检测算法。一种是基于特征增强与融合的显著物体检测方法。该方法首先利用卷积神经网络提取RGB图像的不同卷积层的特征,然后使用图像的高层特征信息指导低
条码作为一种快速识读技术,已经广泛地应用在商品结算、物流运输、仓库管理等领域。常见的有一维条码和二维条码,二维条码广泛地应用在移动支付、电子商务、产品追溯等领域,目前市场上应用的是黑白二维条码,本文将研究如何在黑白二维条码中添加颜色信息,来提高信息存储容量和安全性。本文以目前市场上应用最广泛的QR码为研究对象,为了增大信息容量,将彩色信息附加到QR码点阵图上来传递附加信息,QR码点阵图传递的信息称
随着数字技术的迅猛发展,以及各种强大的图像处理工具的广泛使用,非专业人士可以在不留下任何可见线索的情况下对数字图像进行美化、编辑、甚至修改和伪造,这将破坏图像内容的原始性、完整性和真实性。同时,虚假图像的存在和传播降低了数字内容的可信度,在科学研究、新闻传媒、司法取证、金融和军事等诸多领域造成了严重的负面影响。因此,迫切需要开发功能强大的图像篡改检测工具/算法来识别图像内容的篡改,保证图像内容的原
随着信息化时代的不断进步,二维码由于信息承载量大、编码类型众多、可加密、成本低、易制作等优点应运而生,日渐渗透于人们的衣、食、住、行各个方面。然而,传统黑白二维码逐渐地暴露出自身的不足:一方面,由于二维码是一种由黑白模块构成的矩形码,外观无法满足人们对视觉交互的要求,因此迫切需要对其美术表现形式进行视觉改进;另一方面,传统二维码无法对存储信息进行预读,容易造成误扫。因此,如何优化传统二维码的视觉体
高分辨率图像能够提供较丰富的空间结构信息,是彩色和光谱成像设备的重要发展方向。然而,受成像设备的硬件限制、噪声及传输过程中的压缩等因素影响,采集得到的图像分辨率通常不够理想,易导致所成像场景目标的部分关键信息丢失。因此,在以上成像条件限制下,提升图像的分辨率,即图像超分辨率重建技术,对信息的挖掘和利用具有重要意义。近年来,图像超分辨率已经被广泛应用于监控识别、无人驾驶和医学成像等技术领域,并且已经
图像分割和目标检测一直是图像分析与计算机视觉领域的重点研究课题。随着近几十年来复杂网络理论的快速发展,将复杂网络理论应用到图像分析与计算机视觉领域成为研究人员关注的问题之一。本文以复杂网络理论中的社团检测和节点度分布理论为中心,对图像网络的构建、图像分割和视频中运动目标检测算法进行了研究。具体研究内容如下。(1)提出了一种基于局部网络模块度增量的超像素分割算法(LocalNet)。以像素点颜色相似