论文部分内容阅读
[摘 要]在唐卡图像绘制中,四臂观音通常手持物为莲花和念珠,这两个法器可作为识别此类唐卡图像的参考。本文首先采用基于颜色的区域生长算法实现目标图像分割,接下来利用颜色特征、形状特征和纹理特征作为主要的特征参数进行特征提取,最后使用改进的KNN方法完成目标区域的识别,并给出识别结果作为最终的概念标注。实验结果表明该方法的正确性和可行性。
[关键词]唐卡 四臂观音 图像标注 KNN
中图分类号:TP311.5 文献标识码:A 文章编号:1009-914X(2016)22-0309-01
1.引言
唐卡图像中绘制的四臂观音(4 hands Avalokiteshvara)是雪域西藏的守护神与文殊菩萨、金刚手菩萨,合称三族姓尊,代表大悲、大智、大力,为密乘行者人人必修的法门。有经书记载:寂静相的四臂观音像造型优美,一头四臂,身颜洁白如月,头戴五佛冠,发黑色结髻,中央二手合掌于胸前,捧有摩尼宝珠,右手持水晶念珠,左手拈八瓣莲花与耳际齐,面貌寂静含笑[1]。通常,在一幅唐卡图像的众多特征中,法器可描述出主尊的身份、地位及象征意义,因此可通过标注四臂观音本尊所持法器——莲花和念珠作为识别此类唐卡图像的参考。
2.唐卡图像中法器对象的特征提取与分析
2.1 唐卡图像中法器对象的分割
图像标注的关键工作之一是将目标对象正确分割出来。唐卡图像构图复杂、色彩丰富、纹理众多,目标对象往往不是单独呈现,而是与背景或其他对象交叠呈现,不易区分,因此自动分割很难实现,人工交互方式成为一种有效可行的选择[2-3]。该算法的实现过程如下:
步骤1:在唐卡原始图像中用鼠标划定矩形区域,提取法器目标对象区域并显示;
步骤2:初始化分割图像,图像大小同上述法器目标对象区域;
步骤3:鼠标左键获取法器目标对象区域任一点位置坐标;
步骤4:提取该位置坐标的颜色值,在法器目标对象区域内寻找与该点颜色相近的点(颜色差值在某一阈值范围之内)并保留其颜色值;
步骤5:当未点击鼠标右键时,返回Step3;
步骤6:得到唐卡图像中法器对象分割结果。
2.2 唐卡图像中法器对象的特征提取
1) 颜色特征参数
颜色特征是图像的主要属性之一,它是人们对图像的视觉感受,通过颜色特征人们了解图像中事物对象的表面性质。经过分析,待识别的法器在颜色上具备一定的规律性,念珠的颜色多为白色和褐色,莲花的颜色多为粉红色,也有一部分蓝色. 本文选择HSV颜色模型提取颜色特征。HSV颜色空间主要有两个特点:色调和饱和度分量与人感受颜色的方式,是紧密相连的;亮度分量与图像的彩色信息无关。HSV颜色空间对应于人眼颜色视觉特征的三要素,各通道之间相互独立,可以独立感知各颜色分量的变化,因此应用这种色彩模型更能符合人的视觉判断。
2) 形状参数
经过图像分割得到目标区域之后,可以使用区域描绘子作为代表该区域的特征。常用的区域描绘子有:周长、面积、致密性、区域的质心、灰度均值、灰度中值、包含区域的最小矩形等。本文对目标图像计算得到面积和、欧拉数、密度均值和长短轴比值作为特征参数。
由于特征对象的形状的大小,方向等并不固定,因此仅以区域描述子作为形状特征远远不够,应采用对这些变化不太敏感的描述方法..Hu矩和Zernike矩通常用来描述形状不变特性, Zernike矩多用于恢复重建图像,而Hu矩对于基本的形状完全可以表达其形状特征.本文对目标图像计算得到了7个Hu矩特征参数.
3)纹理参数
局部二进制模式方法LBP,在计算时类似于滤波过程中的模板操作, 对图像逐行进行扫描,对于图像中的每一个像素点,以该点的灰度作为阈值,对其周围3×3的8邻域进行二值化,按照一定的顺序将二值化的结果组成一个8位二进制数,以此数的值(0~255)作為该点的响应.为了减少冗余的LBP数目,同时又保留充足的纹理描绘能力,后来有人提出了统一化模式的方法,这种方法可以大大减少特征数目.但这种方法易受噪声的影响而不够健壮,因此Zhang L等人提出的MB-LBP算法可以弥补这一缺点.其改进的地方为将3×3窗口中每个像素点的灰度值变为多个像素灰度的平均值.采用该算法,在每个块中可以提取出LBP直方图特征向量59个.
经过实验发现,对于唐卡目标图像的纹理特征提取首先计算整体图像块的LBP特征值,然后通过3×3的9方格划分后提取目标图像的局部纹理LBP特征值,算法如下:
步骤1:计算histLBP1=getLBPHist(I,1,1,1);分为1行×1列1块,块大小=1,计算直方图得到59维向量(I为经过预处理的唐卡法器目标图像);
步骤2:计算histLBP2=getLBPHist(I,3,3,10);分为3行×3列9块,块大小=10,计算直方图得到531维特征向量;
步骤3:将特征向量合并: histLBP=[histLBP1,histLBP2];合并后得到59+531=590维特征向量.
步骤4:降维处理,由上述方法得到的特征维数过于庞大,进行降维处理.本文采用特征抽取的方法进行降维计算,主要有标准差和熵.
3.唐卡图像中法器对象的识别
3.1 唐卡图像中法器对象的识别方法
在上述目标对象特征提取的基础上,本文采用一种基于距离密度的最近邻方法做分类和识别.
k-近邻算法的分类方法为:一种原型模式向量代表一个类别,然后计算和其最近的欧式距离,来判定分类结果.设待测样本为xi=(x1,x2,…xn),样本空间中的每一点定义为yj=(y1,y2,…yn),则待测样本与样本空间每一个样本的距离定义为:
(1)
遍历样本空间中所有待测点与已知点的距离,找出最接近待测点的k个样本点,计算其统计值,取某一类的距离值最多的为待测样本类别.该算法简单,应用方便,但性能略差[6-7].
4.存在问题及改进思路
虽然通过上述方法较好的实现了四臂观音类唐卡图像中莲花和念珠的标注和识别,但是仍然存在以下问题需要改进。
1)图像中本尊的手与手持的念珠很难精确区分,尤其是白色念珠(因本尊手肤色是白色),所以在念珠识别过程中,错误率较多;
2)图像的彩云与莲花在形状上非常类似,因此选取彩云区域时也会识别为莲花;
3)图像特征选择与提取会后续的分类识别至关重要,因此需要通过进一步实验与分析加强此步骤的处理。
参考文献:
[1]冯骥才.中国唐卡艺术集成·玉树藏娘卷.阳光出版社.2010.5
[2]解辉,王维兰,刘华明,梁弼.一种颜色的划分识别方法在唐卡图像分类中的应用.《模式识别研究进展》――2007年全国模式识别学术会议论文集.科学出版社.p423-428
基金支持:
受国家自然基金项目(61561042),2015年中央高校基本科研业务费专项资金项目 “统计与规则相结合的唐卡领域文本知识自动抽取研究”(31920150082)),2014年度研究生科研创新项目“唐卡领域知识中概念及概念间关系的抽取究”( Yxm2014057 ) ,西北民族大学研究生教育教学改革研究项目资助。
[关键词]唐卡 四臂观音 图像标注 KNN
中图分类号:TP311.5 文献标识码:A 文章编号:1009-914X(2016)22-0309-01
1.引言
唐卡图像中绘制的四臂观音(4 hands Avalokiteshvara)是雪域西藏的守护神与文殊菩萨、金刚手菩萨,合称三族姓尊,代表大悲、大智、大力,为密乘行者人人必修的法门。有经书记载:寂静相的四臂观音像造型优美,一头四臂,身颜洁白如月,头戴五佛冠,发黑色结髻,中央二手合掌于胸前,捧有摩尼宝珠,右手持水晶念珠,左手拈八瓣莲花与耳际齐,面貌寂静含笑[1]。通常,在一幅唐卡图像的众多特征中,法器可描述出主尊的身份、地位及象征意义,因此可通过标注四臂观音本尊所持法器——莲花和念珠作为识别此类唐卡图像的参考。
2.唐卡图像中法器对象的特征提取与分析
2.1 唐卡图像中法器对象的分割
图像标注的关键工作之一是将目标对象正确分割出来。唐卡图像构图复杂、色彩丰富、纹理众多,目标对象往往不是单独呈现,而是与背景或其他对象交叠呈现,不易区分,因此自动分割很难实现,人工交互方式成为一种有效可行的选择[2-3]。该算法的实现过程如下:
步骤1:在唐卡原始图像中用鼠标划定矩形区域,提取法器目标对象区域并显示;
步骤2:初始化分割图像,图像大小同上述法器目标对象区域;
步骤3:鼠标左键获取法器目标对象区域任一点位置坐标;
步骤4:提取该位置坐标的颜色值,在法器目标对象区域内寻找与该点颜色相近的点(颜色差值在某一阈值范围之内)并保留其颜色值;
步骤5:当未点击鼠标右键时,返回Step3;
步骤6:得到唐卡图像中法器对象分割结果。
2.2 唐卡图像中法器对象的特征提取
1) 颜色特征参数
颜色特征是图像的主要属性之一,它是人们对图像的视觉感受,通过颜色特征人们了解图像中事物对象的表面性质。经过分析,待识别的法器在颜色上具备一定的规律性,念珠的颜色多为白色和褐色,莲花的颜色多为粉红色,也有一部分蓝色. 本文选择HSV颜色模型提取颜色特征。HSV颜色空间主要有两个特点:色调和饱和度分量与人感受颜色的方式,是紧密相连的;亮度分量与图像的彩色信息无关。HSV颜色空间对应于人眼颜色视觉特征的三要素,各通道之间相互独立,可以独立感知各颜色分量的变化,因此应用这种色彩模型更能符合人的视觉判断。
2) 形状参数
经过图像分割得到目标区域之后,可以使用区域描绘子作为代表该区域的特征。常用的区域描绘子有:周长、面积、致密性、区域的质心、灰度均值、灰度中值、包含区域的最小矩形等。本文对目标图像计算得到面积和、欧拉数、密度均值和长短轴比值作为特征参数。
由于特征对象的形状的大小,方向等并不固定,因此仅以区域描述子作为形状特征远远不够,应采用对这些变化不太敏感的描述方法..Hu矩和Zernike矩通常用来描述形状不变特性, Zernike矩多用于恢复重建图像,而Hu矩对于基本的形状完全可以表达其形状特征.本文对目标图像计算得到了7个Hu矩特征参数.
3)纹理参数
局部二进制模式方法LBP,在计算时类似于滤波过程中的模板操作, 对图像逐行进行扫描,对于图像中的每一个像素点,以该点的灰度作为阈值,对其周围3×3的8邻域进行二值化,按照一定的顺序将二值化的结果组成一个8位二进制数,以此数的值(0~255)作為该点的响应.为了减少冗余的LBP数目,同时又保留充足的纹理描绘能力,后来有人提出了统一化模式的方法,这种方法可以大大减少特征数目.但这种方法易受噪声的影响而不够健壮,因此Zhang L等人提出的MB-LBP算法可以弥补这一缺点.其改进的地方为将3×3窗口中每个像素点的灰度值变为多个像素灰度的平均值.采用该算法,在每个块中可以提取出LBP直方图特征向量59个.
经过实验发现,对于唐卡目标图像的纹理特征提取首先计算整体图像块的LBP特征值,然后通过3×3的9方格划分后提取目标图像的局部纹理LBP特征值,算法如下:
步骤1:计算histLBP1=getLBPHist(I,1,1,1);分为1行×1列1块,块大小=1,计算直方图得到59维向量(I为经过预处理的唐卡法器目标图像);
步骤2:计算histLBP2=getLBPHist(I,3,3,10);分为3行×3列9块,块大小=10,计算直方图得到531维特征向量;
步骤3:将特征向量合并: histLBP=[histLBP1,histLBP2];合并后得到59+531=590维特征向量.
步骤4:降维处理,由上述方法得到的特征维数过于庞大,进行降维处理.本文采用特征抽取的方法进行降维计算,主要有标准差和熵.
3.唐卡图像中法器对象的识别
3.1 唐卡图像中法器对象的识别方法
在上述目标对象特征提取的基础上,本文采用一种基于距离密度的最近邻方法做分类和识别.
k-近邻算法的分类方法为:一种原型模式向量代表一个类别,然后计算和其最近的欧式距离,来判定分类结果.设待测样本为xi=(x1,x2,…xn),样本空间中的每一点定义为yj=(y1,y2,…yn),则待测样本与样本空间每一个样本的距离定义为:
(1)
遍历样本空间中所有待测点与已知点的距离,找出最接近待测点的k个样本点,计算其统计值,取某一类的距离值最多的为待测样本类别.该算法简单,应用方便,但性能略差[6-7].
4.存在问题及改进思路
虽然通过上述方法较好的实现了四臂观音类唐卡图像中莲花和念珠的标注和识别,但是仍然存在以下问题需要改进。
1)图像中本尊的手与手持的念珠很难精确区分,尤其是白色念珠(因本尊手肤色是白色),所以在念珠识别过程中,错误率较多;
2)图像的彩云与莲花在形状上非常类似,因此选取彩云区域时也会识别为莲花;
3)图像特征选择与提取会后续的分类识别至关重要,因此需要通过进一步实验与分析加强此步骤的处理。
参考文献:
[1]冯骥才.中国唐卡艺术集成·玉树藏娘卷.阳光出版社.2010.5
[2]解辉,王维兰,刘华明,梁弼.一种颜色的划分识别方法在唐卡图像分类中的应用.《模式识别研究进展》――2007年全国模式识别学术会议论文集.科学出版社.p423-428
基金支持:
受国家自然基金项目(61561042),2015年中央高校基本科研业务费专项资金项目 “统计与规则相结合的唐卡领域文本知识自动抽取研究”(31920150082)),2014年度研究生科研创新项目“唐卡领域知识中概念及概念间关系的抽取究”( Yxm2014057 ) ,西北民族大学研究生教育教学改革研究项目资助。