面向漫画图像理解的视觉模式提取方法研究

来源 :北京大学 | 被引量 : 0次 | 上传用户：sunqingshu

【摘要】

：

漫画作为一种特殊的休闲娱乐类出版物，通常由简单形象的绘画内容和少量的文字构成，深受不同国家各年龄段阅读者的喜爱。随着移动终端（如智能手机、平板电脑、电子书阅读器）的普及

【作者】

：

刘冬

【机构】

：

北京大学

【出处】

：

北京大学

【发表日期】

：

2014年期

【关键词】

：

漫画图像理解边缘链提取直线段提取圆提取分镜多边形提取视觉模式

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

漫画作为一种特殊的休闲娱乐类出版物，通常由简单形象的绘画内容和少量的文字构成，深受不同国家各年龄段阅读者的喜爱。随着移动终端（如智能手机、平板电脑、电子书阅读器）的普及，越来越多的读者开始基于移动终端阅读漫画电子内容，漫画移动阅读已逐渐成为漫画数字出版产业的发展趋势。然而，现有的漫画电子出版物及以往大量的历史纸质出版物通常按照纸质媒介的大小进行排版设计，受漫画内容及排版布局、移动终端屏幕大小及分辨率的限制，无法在移动终端上清晰完整地展示，该问题严重制约了漫画数字出版产业的发展。为了满足漫画移动阅读内容制作上的要求，需要提取出漫画图像中不同层次的视觉模式以实现漫画图像版面理解，从而将现有的漫画出版物制作成适合移动阅读的漫画电子内容。　　面向漫画图像理解的视觉模式提取方法研究旨在分析图像底层视觉模式包括边缘链、直线段、圆，并将其应用到漫画图像中层视觉模式提取中，为实现漫画图像理解提供基础数据，从而进一步生成适合移动阅读的漫画电子内容。针对漫画图像理解与视觉模式提取的研究进展，本文提出的视觉模式提取方法主要包括两部分:(1)提取出图像底层视觉模式，通过一种高效的启发式边缘点链接方法得到连续有序的边缘点集，从而提取出图像中平滑的边缘链，并基于自顶向下的边缘链分析方法，分别提取出图像中的直线段和圆，同时结合假设验证方法有效控制虚警;(2)将图像底层视觉模式提取方法应用到漫画图像分镜多边形（中层视觉模式）提取的研究中，通过分析漫画图像分镜连通性，将满足紧凑性和完整性度量的直线段拼接结果接受为分镜多边形。　　本文提出的面向漫画图像理解的视觉模式提取方法的创新之处主要包括:(1)提出一种启发式的边缘点分层链接方法，能够快速提取出图像中的边缘链，并体现边缘点之间的相对位置关系，其结果较现有的方法更加完整与平滑;(2)提出一种自顶向下的边缘链分析方法，能够分别提取出图像中的直线段与圆，且通过积分链方法进行加速，与现有自底向上的方法相比，该方法具备更强鲁棒性;(3)提出一种基于图像底层视觉模式和分镜连通性分析的漫画图像分镜多边形提取方法，使用直线段拼接及紧凑性与完整性度量提取分镜多边形，不受限于直线段的相对位置关系，具备普遍的适应性。实验证明，本文方法能够快速提取出图像中完整的边缘链、直线段、圆等底层视觉模式，对于噪声、波动、阴影等情况具有较强鲁棒性。同时，本文方法在包含10种不同系列的2000页漫画图像数据集上进行实验，能够快速提取出漫画图像分镜多边形，且在分镜粘连、分镜带突出部分、分镜不封闭、无分镜包围框、分镜断裂等复杂漫画图像布局情况下，仍然能够取得较为准确且完整的结果。

其他文献

基于特征统计的视频失真检测和质量评价方法研究

随着以计算机和互联网为核心的信息技术的长足发展，视频的获取、处理和传输方式逐渐实现了数字化，促进了视频内容的极大丰富。当前，数字视频技术继续朝两个方向发展:一方面是视

学位

质量评价马赛克特征统计失真检测数字视频收视体验

基于CORBA的智能式分布系统的研究

CORBA技术因其出色的跨平台、多语言支持等特性成为分布式应用系统的开发平台和支撑框架，在电信、制造、金融等许多领域得到了广泛的应用。但是CORBA存在着一些固有的缺陷，其中

学位

CORBA移动AgentORBMASIF

数据聚类及其应用研究

聚类是指根据事物的特征对其进行聚类,即所谓的"物以类聚",是最重要的数据挖掘技术之一.除传统的聚类方法外,近年来模型聚类、神经网络聚类方法也有了长足发展.聚类在众多领

学位

数据聚类数据挖掘

基于交通网络的最短路线选择方法的研究

交通是维系人类生存发展的命脉,其功能是实现人和物空间位置的有序移动.近半个世纪以来,随着城市化进展和汽车普及,交通与需求、交通与环境、交通与能源之间的矛盾日益加剧.I

学位

路线导航系统选路策略路段行程时间预测路线行程时间预测K-时间最短路线算法

嵌入式邮件客户端I-mail的设计与实现

进入21世纪，伴随着嵌入式系统网络化、多功能化的发展，嵌入式网络软件开始被广泛应用到嵌入式系统中，以满足各种网络通讯需求。嵌入式邮件客户端，作为一种重要的嵌入式网络通讯软

学位

嵌入式邮件客户端邮件接收邮件预取

基于中间件的分层体系集成模型的研究

鉴于分布式应用计算模型的复杂性和异构性,其开发仍然是研发人员需要面对的一个主要问题.在这些分布式应用中,数据的多样性、冗余和不一致,带来了诸如互操作性和信息共享的一

学位

中间件集成模型MQSeries民航机场AODB

基于可信敏感字符标记的SQL注入防护技术研究

随着互联网越来越深层次地改变人们的生活，Web安全一直受到各界关注，也是信息安全领域的重要研究课题。SQL注入攻击是Web安全领域历史最悠久、使用最广泛的攻击。虽然已诞生十

学位

注入攻击可信敏感字符标记动态污点分析Web安全自动化防护

RFID系统中标签防碰撞算法的研究与应用

RFID(Radio Frequency Identification)射频识别技术,是一种采用无线射频方式进行非接触双向数据通信,对目标加以识别并获取相关数据集的技术。因为其具有不需要人工干预、不

学位

ALOHA算法二进制标签防碰撞算法哈希分组智能家居

自动指纹识别技术研究

该论文综合运用图像处理和模式识别技术,比较深入地研究了自动指纹识别技术.全文内容共分五章.第一章绪论;第二章指纹图像预处理;第三章指纹分类;第四章基于分类的匹配;第五

学位

图像处理模式识别技术指纹匹配指纹识别

高性能片上末级高速缓存管理策略研究

随着集成电路制造工艺的快速发展，处理器和主存之间的性能差距越来越大。为了填补该性能差距，现代处理器已经把芯片上一半以上的晶体管用于实现多级片上高速缓存。其中片上末级

学位

末级高速缓存管理策略芯片设计最优旁路算法替换策略

面向漫画图像理解的视觉模式提取方法研究

与本文相关的学术论文