基于视觉注意机制的静态图像压缩方法研究

来源 :河北工业大学 | 被引量 : 2次 | 上传用户:game00vergoo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于感兴趣区域ROI(Region of Interest)的图像压缩方法,具有在不丢失重要信息的同时又能有效地压缩数据量的特点。本文为了能自动提取自然图像中的主要视觉信息,引入了视觉感知模型。在对由数据驱动的自底向上以及与任务相关的自顶向下注意模型进行分析的基础上,本文重点研究了基于数据驱动的Itti视觉计算模型。根据Itti模型的建模思想结合图像压缩的具体应用,提出了改进措施,为图像中感兴趣区域难以自动确定的问题提供了解决方法。本文模型相比Itti模型提出了以下改进:1改进模型除提取图像的颜色、亮度、方向特征之外,利用canny算子提取输入图像中物体的边缘,并对含有物体边缘的图像进行填充,由填充后所得图像轮廓特征融入到模型计算过程中,将其用于得到图像总显著图,以提高模型提取显著区域的精确度。2改进模型中对特征图的合并策略,将原有的特征图平均相加的方法改成非线性的合并策略,特征图合并生成显著图时显著点密度过大的特征图对形成该特征的显著图所做贡献不大,因此在特征图合并时设置相应阈值去除显著点密度过大的特征图。3改进了模型中原有的视觉注意焦点转移策略,根据输入图像总显著图一次性确定输入图像所有的显著区域,提高了模型运算效率,使改进模型的运算时间只有原模型3%左右,使之适用于图像压缩中ROI的准确提取。另外,对JPEG2000图像压缩标准进行了探讨,分析了其中的一般平移法和最大偏移法,利用算法中对图像感兴趣区域压缩编码的方法,给出了改进的感知模型与图像压缩相结合的具体方法。由视觉感知模型确定图像的感兴趣区域掩膜,将之与其对应的图像一起用于该幅图像的感兴趣区域压缩编码。通过相关的仿真实验,表明了本文所提算法的有效性。
其他文献
近些年来,支持向量机由于其坚实的理论基础,实现了结构化的风险化最优,被作为分类工具广泛应用在机器学习的许多领域。传统的支持向量机需要解决一个二次规划的问题。这个问题的
无线Mesh网络因为具有自组织、自配置、低成本、维护简单、鲁棒性强、覆盖范围稳定等特点受到人们的关注。但其也具有无线网络中存在的一些安全问题,一方面无线链路容易受到攻
社会网络中的链接预测是数据挖掘领域的一个重要分支,也是一个社会网络分析的子任务。链接预测的研究内容包括与人们生活密切相关的网络,还包括对科学理论研究有重要意义的网络
自然界中存在的很多系统可以用网络的形式表示,如人际关系网、蛋白质作用网络、交通网络等。这些网络具有很高的复杂性,因此被称为“复杂网络”。社区结构是复杂网络研究的几
  动态场景下的运动目标检测是视频序列中目标识别、跟踪和行为分析等后续处理的基础和关键,在视频监控、智能交通及军事领域中有着广泛的应用。由于摄像机的平移、旋转和缩
近年来,随着城市现代化水平的提高,带了诸如交通拥堵、环境污染、道路使用率低等问题,世界各国都面临交通问题带来的困扰。智能交通系统(Intelligent Traffic System)的提出,让世界
运动参数估计是计算机视觉的一个基本问题,也是模式识别和目标跟踪领域的一个核心问题,运动参数估计的基本任务是从图形序列中检测出运动信息,估计目标的运动参数,预测出目标的位
网络人脉的推荐研究多利用图论的方法,对构造出来的社会网络关系图的结点和边进行探讨,其中结点代表社会网络参与者(即用户),连结两个结点的边代表参与者之间的某种关系(比如互
  针对基于内容的图像检索中广泛存在的“语义鸿沟”问题,提出一种基于小波轮廓的图像语义标注方法,在图像分割阶段利用膨胀和腐蚀原理对分割区域面积进行调整,通过消除斑点和
  随着信息化社会的不断加快,人类迫切地需要功能更加强大、界面更加友好、更趋向人性化的人机交互技术。单一模式的视觉或者听觉处理模型已经不能满足人们日常的生活需要,以