论文部分内容阅读
漫画作为一种特殊的休闲娱乐类出版物,通常由简单形象的绘画内容和少量的文字构成,深受不同国家各年龄段阅读者的喜爱。随着移动终端(如智能手机、平板电脑、电子书阅读器)的普及,越来越多的读者开始基于移动终端阅读漫画电子内容,漫画移动阅读已逐渐成为漫画数字出版产业的发展趋势。然而,现有的漫画电子出版物及以往大量的历史纸质出版物通常按照纸质媒介的大小进行排版设计,受漫画内容及排版布局、移动终端屏幕大小及分辨率的限制,无法在移动终端上清晰完整地展示,该问题严重制约了漫画数字出版产业的发展。为了满足漫画移动阅读内容制作上的要求,需要提取出漫画图像中不同层次的视觉模式以实现漫画图像版面理解,从而将现有的漫画出版物制作成适合移动阅读的漫画电子内容。 面向漫画图像理解的视觉模式提取方法研究旨在分析图像底层视觉模式包括边缘链、直线段、圆,并将其应用到漫画图像中层视觉模式提取中,为实现漫画图像理解提供基础数据,从而进一步生成适合移动阅读的漫画电子内容。针对漫画图像理解与视觉模式提取的研究进展,本文提出的视觉模式提取方法主要包括两部分:(1)提取出图像底层视觉模式,通过一种高效的启发式边缘点链接方法得到连续有序的边缘点集,从而提取出图像中平滑的边缘链,并基于自顶向下的边缘链分析方法,分别提取出图像中的直线段和圆,同时结合假设验证方法有效控制虚警;(2)将图像底层视觉模式提取方法应用到漫画图像分镜多边形(中层视觉模式)提取的研究中,通过分析漫画图像分镜连通性,将满足紧凑性和完整性度量的直线段拼接结果接受为分镜多边形。 本文提出的面向漫画图像理解的视觉模式提取方法的创新之处主要包括:(1)提出一种启发式的边缘点分层链接方法,能够快速提取出图像中的边缘链,并体现边缘点之间的相对位置关系,其结果较现有的方法更加完整与平滑;(2)提出一种自顶向下的边缘链分析方法,能够分别提取出图像中的直线段与圆,且通过积分链方法进行加速,与现有自底向上的方法相比,该方法具备更强鲁棒性;(3)提出一种基于图像底层视觉模式和分镜连通性分析的漫画图像分镜多边形提取方法,使用直线段拼接及紧凑性与完整性度量提取分镜多边形,不受限于直线段的相对位置关系,具备普遍的适应性。实验证明,本文方法能够快速提取出图像中完整的边缘链、直线段、圆等底层视觉模式,对于噪声、波动、阴影等情况具有较强鲁棒性。同时,本文方法在包含10种不同系列的2000页漫画图像数据集上进行实验,能够快速提取出漫画图像分镜多边形,且在分镜粘连、分镜带突出部分、分镜不封闭、无分镜包围框、分镜断裂等复杂漫画图像布局情况下,仍然能够取得较为准确且完整的结果。