基于深度特征的抠图算法研究

来源 :山东工商学院 | 被引量 : 0次 | 上传用户:mynameisfish
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
抠图(Matting)是指将静态图像或者视频图片序列中的前景对象精确提取出来的过程。如今抠图技术已是计算机视觉领域中的关键技术之一,更是图像合成技术的基础,已广泛应用在了虚拟演播厅、影视剧的制作、图像编辑等多个领域中。而在实际应用中,由于图像复杂多变导致抠图实施起来十分困难,为了降低抠图的复杂度,在处理抠图问题时通常需要用户提供一个先验信息。该先验信息一般以三分图(Trimap)的形式来呈现,尽管三分图的出现大大降低了处理抠图问题的难度,但抠图算法性能的好坏很大程度上取决于三分图的精确度,而一幅精确的三分图往往需要耗费大量的人力物力,这在现实生活中显然不可取。并且传统抠图算法十分依赖图像的颜色、纹理等低级信息,导致这些算法在处理图像中如毛发、孔洞、前景边缘等细节时往往会出现较大的错误。本文深入分析了图像抠图存在的问题,从优化用户提供的先验信息出发,重点研究基于图像深度特征信息的自然图像抠图算法。本文的主要创新点包括:(1)提出了基于编解码网络的三分图优化算法。由于在一幅粗糙三分图的未知区域中含有大量前背景中的像素,影响抠图算法最终获得的透明度遮罩图的质量,为了解决该问题,本文将其看作一个对像素进行三分类的问题来处理,利用编解码网络对图像深度特征信息的提取能力,在交叉熵损失函数的指导约束下,最终实现了对未知区域中每个像素的精确分类,从而解决了三分图粗糙的问题,保证了用户提供的三分图的精确度。(2)提出了基于嵌入改进SK-Net的DenseNet抠图算法。过度的依赖图像中颜色、纹理等低级信息势必会影响抠图算法的性能,本文利用DenseNet网络模型充分提取图像中的深度特征,有效改善了传统抠图算法过度依赖图像低级信息的缺点。并且在DenseNet中嵌入改进后的Sk-Net网络,大大增强了有用深度特征信息在网络模型中的传播,并且抑制了无用特征信息的传播。通过使用CF算法与KNN算法的抠图结果作为网络模型输入的一部分,有效的协同利用了图像中的局部与非局部信息。最终,通过对网络模型的训练达到了预期的效果,实验结果表明,该方法能够有效的预测出图像的透明度遮罩图。(3)提出了基于GAN网络的抠图算法。基于深度学习的抠图算法改善了传统抠图算法过度依赖图像低级信息的缺点,但是大部分基于深度学习的抠图算法忽略了对于深度特征信息的多级联结以及多尺度融合,致使这些算法在处理一些结构复杂的图像时,依然会出现较大的错误,因此,本文利用GAN网络强大的生成能力,使用嵌套的编解码网络作为GAN网络中的生成器,改善了该问题。通过使用自校准卷积代替普通的标准卷积,在不显著增加计算量的同时提高了网络模型对图像深度特征信息的提取能力。最终,通过对网络模型的训练达到了预期的效果,最终实验结果表明,该方法也能够有效的预测出图像的透明度遮罩图。通过实验证明,本文提出的方法能够有效的改善现存抠图算法的缺陷,提高透明度遮罩图的质量,推动抠图技术的发展,使之在图像合成、影视剧制作等方面的应用更加广泛。
其他文献
现代社会高度依赖互联网,人们在享受着网络服务带来的便利性的同时,也面临着网络攻击带来的威胁。低速率拒绝服务(Low-Rate Denial of Service,LDoS)攻击是一种新型的网络攻击方式,具有隐蔽性强、攻击速率低和检测难度大等特点。软件定义网络(Software Defined Network,SDN)作为下一代网络的热门解决方案,解耦了数据平面和控制平面,采用软件定义的方式对网络进
基于全球化、信息化和我国当前课程改革的背景下。要求人们能够创造性地运用知识与技能来解决实际生活中所发生的问题,在各种复杂的信息和智能化环境中有效迁移处理、解决问题,需要人们具备高阶思维能力,同时也是落实核心素养的具体体现。高阶思维能力是一个人以创新能力和批判性思维能力为核心,进行问题解决的高层次认知活动过程中所表现的综合能力。界定高阶思维能力主要由问题解决能力、批判性思维能力和创新能力构成。由此,
命名实体识别是自然语言处理的一项基础任务,其目的是识别文本数据中人名、地名、机构名等类型的实体。命名实体识别效果对后续的关系抽取、机器翻译、知识图谱等任务有很大影响。近年来,深度学习被广泛用于命名实体识别任务,并取得了很好的效果。然而,现有的深度学习方法大多为有监督的训练方法,在特定领域命名实体识别任务中,由于缺乏标注数据,使得依赖大量标注数据的深度学习模型难以取得优异的性能。本文从半监督集成学习
高中物理教师的教学工作不可能尽善尽美,均会存在不足,这就需要教师不断地进行教学反思,但是大部分教师在教学反思时有一定的主观性和局限性。学生错题作为一种宝贵的教学资源不仅反映了学生的学习情况,还暴露了教师教学的不足之处,可以帮助教师进行教学反思,这就需要教师对学生的错题进行管理,因此建立易错题集作为教师对学生错题管理的有效途径可以有效地指导教师的教学反思。该研究首先介绍了相关研究背景和现状,给出了核
“审美”是音乐教育的核心本质,我国高中音乐学科无论是从课程理念还是音乐教材都一贯体现着“审美”的核心理念。本文以2004年我国教育部出台的《普通高中音乐课程标准(实验)》和2017年《普通音乐课程标准(2017年版)》为指导目标,对课程标准提出的“审美”理念,以人民音乐出版社和湖南文艺出版社出版的高中《音乐鉴赏》教材为例,进行初浅的研究和比较分析。本论文采用了文献分析法、比较研究法、调查研究法和实
多目标跟踪因为其重要的学术价值和非凡的商业潜力,在计算机视觉领域备受关注,例如在自动驾驶、航空航天、医疗诊断、智能监控等众多领域得到了广泛的应用。在最近的十几年中,研究人员已经提出了大量的创新算法来研究这个课题,多目标跟踪的技术取得了很大的发展,但在面临诸如目标重叠、外观剧变、光照变换、身份跳变等问题时,仍然存在着重大挑战。本文旨在从多目标跟踪中的数据关联出发,利用行人重识别技术,分别与多假设跟踪
当标注数据充足的情况下,现有的文本分类方法已经可以取得比较好的效果。近来基于深度学习的文本分类方法的发展,已经使得文本分类任务的性能达到了工业界的应用要求,特别是基于预训练+微调的两阶段文本分类方法,更是将文本分类的效果推上了一个前所未有的高度。但文本分类效果提升的同时,模型的复杂度也在迅速的增加,对标注数据集的规模以及质量的要求也在不断提高,使得应用场景很是受限。在实际应用中文本分类任务的训练数
深度学习方法在图像分类任务中取得了巨大成功,然而深度神经网络模型的优异表现高度依赖海量的标签样本数据。当样本数量较少时,模型训练受到限制,易发生过拟合现象且泛化性能差。在实际应用中,海量标签样本的获取往往十分困难。因此,如何高效利用深度学习模型解决小样本图像分类问题具有重要意义。深度度量方法旨在学习一高效度量空间,有效完成输入特征的非线性映射,准确反映样本间相似程度。针对极端的小样本图像分类任务,
本文文言文同义动词的选择范围为2007年3月第2版人民教育出版社出版的《普通高中课程标准语文实验教科书(必修)》。文章从课程标准、教科书课后习题以及一线教师访谈出发分析当前的文言文同义动词教学现状与问题。从教材中挑选出16组常见同义动词,在学习和吸收之前学者的经验成果上,分析词组内部成员之间的异同,再结合教学需要探讨高中文言文同义动词教学策略,也期待为今后的语文教学提供可靠性意见。本文除绪论和结语
关键蛋白质是细胞生活重要物质基础,其缺失会使生物体致病甚至死亡。准确高效识别关键蛋白质可用于了解细胞功能,并且对药物设计提供极其重要的指导与思路。近年来,高通技术飞速发展,大量蛋白质相互作用(Protein-Protein Interaction,PPI)数据被挖掘出来,许多基于PPI网络的关键蛋白质识别方法被提出,这些方法大致分为两类:一类是基于网络拓扑特征,另一类是融合亚细胞定位等其他蛋白质生