论文部分内容阅读
对于电子化量身定制(electronic Made To Measure,eMTM)服装系统的研究,目前主要集中在人体尺寸的获取、样板快速生成和虚拟试衣等方面。服装款式图的获取主要来源于服装设计师的设计。本论文主要采用计算机视觉技术,对服装款式图的逆向提取与模式识别做了系统性的研究,是对传统服装计算机辅助设计(Garment Computer Aided Design,GCAD)系统功能性的扩展。对具体的研究工作与思路概括如下:(1)服装图像的分割和分割效果客观评价方法本文研究两种产生过分割初始图像的算法,最新的图像分割算法gPb-owtucm和Mean shift分割算法。采用gPb-owt-ucm算法处理后,时装模特图像被转换为层次区域树;采用Mean shift算法处理后,时装模特图像被转换为过分割初始图像。然后,从过分割初始图像出发,通过基于最大相似度的区域融合(maximal-similarity based region mergion,MSRM)方法交互实现服装图像分割。最后,采用Garbor结构相似度(Garbor-structural similarity,G-SSIM)用于服装图像分割效果客观评价。gPb-owt-ucm分割算法从gPb轮廓检测器的检测结果出发构建一个分层的区域图,通过调节边界上的概率阈值可以获得过分割初始图像。Mean shift算法可以定位于给定离散样本的密度函数的最大值。在图像分割中,该算法可以直接得到过分割初始图像。给定一个模特图像通过gPb-owt-ucm分层分割算法获得初始的分割结果在两个方面优于Mean shift算法获得的结果。第一,gPb-owtucm分层分割算法在分割纹理密集图像时具有一定的优势;第二,可以通过对UCM设定阈值的方式来控制图像分割粒度,而不需要重新运行程序。基于区域合并的图像分割方法近些年来引起越来越多的关注。从初始的过分割结果开始,这些区域合并方法采用渐进的方法、按照一定合并准则把相似的近邻区域合并成新的区域。颜色直方图作为图像初始分割得到各个区域的特征,并且采用RGB颜色空间计算颜色直方图。两个相邻区域R和Q的相似度ρ(R,Q)作为MSRM的判别准则。作为客观评价方法,CW-SSIM的关键思想是某些图像的扭曲导致局部小波系数的一致相变,而小波系数的一致位移并不能改变图像内容的结构改变。GSSIM对CW-SSIM进行了小的改进,用图像的复数Gabor滤波器系数代替原来的复数小波变换系数。采用MSRM算法对初始分割结果进行区域归并,得到最终的分割结果。我们把用上述两种方法得到的最终分割图像分别与通过Photoshop交互手工提取的基准(Ground Truth)服装图像进行比较,根据G-ssim指数客观评价两种分割效果。(2)服装款式图的提取服装款式图的提取算法主要分为服装轮廓提取和服装内部细节提取两个部分。服装轮廓提取算法包括初始轮廓提取,分支轮廓光滑和全局轮廓光滑处理。带有印花图案服装图像在轮廓附近灰度值与背景相近情况下的初始轮廓提取就会产生纹理噪声。本文引入了轮廓误差和支点概念,采用形态学方法实现对带有印花图案服装图像的初始轮廓的提取。然后将轮廓划分为若干个分支,通过轮廓误差消除纹理噪声,实现分支轮廓光滑。研究表明,基于形态学方法的初始轮廓提取算法可以有效去除服装图像内部的像素点和外部的阴影与水印;采用轮廓误差计算可以有效识别纹理噪声数据,修补印花图案对服装轮廓的影响。与其它轮廓提取方法相比,提出的算法更高效。接下来,对轮廓进行全局光顺化处理。本文通过以下步骤实现初始轮廓的光顺处理:(1)将该曲线在x和y方向上进行分解后,将得到两个一维离散函数;(2)在分解的两个离散函数上分别提取特征点;(3)按特征点分段,分别对分解后的分段数据进行拟合处理,拟合类型是sumofsinfunctions。服装内部细节提取算法是指在光顺化轮廓基础上进行的后续处理。服装款式很多是关于垂直轴对称的,过对称点的水平轴与中垂线一起将服装图像分成四个区域。设置对称点可以避免拷贝时出现错位现象,可以显著减少工作量。接下来,我们提取服装结构边并计算它们的交点。通过鼠标交互操作选择结构边的部分像素点aj(j=1,...,m)为采样点,m为采样点个数;然后,再通过三次光滑样条拟合生成结构边。通常情况下,通过鼠标交互定位一条曲线的两个端点。在实际操作中采用将ai(i=1,...,n)两端延长一段像素点长度为l,即i=1-l,...,n+l。再从曲线的一端向另一端搜索,寻找搜索路径上像素值为1的点为交点,将交点的像素值设置为2。去掉生成曲线中两端的多余部分。(3)服装款式图特征提取及其模式识别本文提出了针对服装款式图分类的一种集成化方法,即wfd-lda-elm方法。采用离散小波和傅里叶变换把服装款式图的轮廓坐标映射到高维特征空间,然后采用lda降维。最后采用elm作为分类器进行多类分类。提出的单尺度wfd无论是降维还是不降维情况下,较其它两种同样长度的描述子的分类准确率都要高。不同长度描述子样本,描述子的长度越长的其分类准确率越低;样本经过lda降维后,描述子的长度越长的其分类准确率越高。同一种描述子在降维到同样长度情况下,lda的分类效果要高于pca。lda为了避免小样本问题,描述子的长度不能取太长。从实验结果来看,传统的集成化分类方法,如fd-svm,mfd-svm和wfd-svm,获得的最好的识别率都低于90%。对于特征提取方法的效率,我们只需要比较WFD-LDA与FD-LDA,因为MFD-LDA容易导致小样本问题。从分类准确率的实验结果来看,WFD-LDA比FD-LDA效果更好一些。本章最后的实验说明了本文所提出的WFD-LDA-ELM集成化方法与WFD-LDA-SVM或WFD-PCA-SVM等相比,综合性能更高。本文采用的方法集成到大型服装设计企业的信息系统中并为下一步的服装款式查询打下基础。此外这种方法也可以应用到基于轮廓描述技术的识别问题中,如纤维截面形状识别。(4)基于建模的翻领识别由于传统的服装部件特征提取都高度依赖服装部件的分割,而图像分割又很难实现。在不分割的情况下实现服装部件的识别是本文的研究的目标。本文以翻领为例,研究在服装款式图中实现服装部件的识别。假设翻领的四条线是共点且对称的。利用这个假设我们可以建立翻领模型。然后通过模型提出了实现部分翻领识别的方法。在图像预处理阶段,图像需要裁剪两次:第一次为了除掉背景,第二次是为了获得感兴趣区域(region of interest,ROI)。在共点识别阶段,该方法利用了Hough变换检测翻领的直线,通过θ选择和曲线拟合限制ROI中的候选线段条数。在对称识别阶段,通过k-means聚类算法将候选直线划分为四类。对应的加权角度之差可以定义为识别准则。我们设置对应加权角度差值阈值,简称对称阈值,用于翻领识别。通过实验可以看出采用本系统能够得到91.7%的识别率。(5)基于CBIR的服装款式图综合检索为了实现服装款式图的综合检索,本文创建了由1229幅JPEG格式存储的款式图数据库,采用了基于内容的图像检索(Content-based image retrieval,CBIR)技术。形状特征采用单尺度小波傅里叶描述子WFD,对轮廓数据用db10小波进行2级分解,长度统一取前40位。将纹理特征分为全局纹理和衣领、门襟和下摆三个局部纹理,采用小波矩作为全局或局部纹理特征的描述。形状特征和各种纹理特征为可选组合。本文提出的局部纹理特征及其组合能够发现一些单纯靠形状和全局纹理不能检索到的款式图。