论文部分内容阅读
【摘 要】笔者在借鉴以往算法思想的基础上,提出了一种新的颜色量化算法。实验证明,在HSV色彩空间中,所提算法在视觉上更为合理。算法结合了模糊理论,将量化边界处模糊化,进行第一次颜色量化,并将颜色量化结果进行二次聚类。大量图像实验表明,此种量化方法既符合人眼的视觉特征,又能有效降低颜色直方图中的冗余信息。
【关键词】色彩空间;颜色量化;模糊聚类
一幅彩色图像包含多种颜色,如果直接提取图像的颜色特征,存储量和计算量将非常大。所以,在提取颜色特征之前,为了减少颜色特征的维数,通常先对颜色进行量化。颜色量化效果的好坏,将直接影响检索结果的精度。本研究将结合基于HSV色彩空间的量化和基于色彩频度的量化思想,提出一种新的颜色量化算法。
一、量化算法的基本思想
由于颜色空间本身的连续性,一幅彩色图像包含多种颜色,如果直接提取图像的颜色特征,存储量和计算量将非常大。所以,为了减少颜色特征的维数,通常在提取颜色特征之前先对颜色进行量化。量化的基本思想是以量化点颜色为轴心,把与该颜色相似的颜色归并到这一类,在最低平均方差下聚类出最少数目的颜色。[ keun-Chang Kwak,Witold Pedrycz.Face Recoion Lgnition: A Study in Information Fusio Using Fuzzy Intergral[J].Pattern Recognition Leters,2005(26):719-733.]一次量化算法产生的颜色类别较多,结果并不适合实际颜色情况,如“黄”色,在实际生活中可能反映为浅黄、深黄、橘黄等,这几个应该聚为一类的颜色在初次聚类时可能被分成了几类。因此,本研究将采用颜色量化最常用的HSV色彩空间和张磊的量化思想[ Zhang Lei,Lin Fuzong,Zhang Bo. A CBIR Method Base on Color-Spatial Feature[A].IEEE Region 10 Annual International Conference 1999,Cheju,Korea,1999:166-169.],结合模糊理论的相关思想,针对不同颜色之间存在的相似性,设计一种新的颜色量化算法。此过程分两步完成:(1 )改进张磊提出的量化算法,完成一次量化。(2)基于实验的二次模糊聚类。
一次量化算法产生的颜色类别较多,结果并不适合实际颜色情况,如“黄”色,在实际生活中可能反映为浅黄、深黄、橘黄等,这几个应该聚为一类的颜色在初次聚类时可能被分成了几类。因此,本研究将借助大量的图像进行实验,最后完成符合颜色表现特点的量化。由于这个过程是通过用大量的实际图像进行实验得到,因此量化结果具有很高的可信度,也是最切合实际的做法。
二、 基于边界模糊化的量化算法
基于人类视觉对颜色的感知特性,张磊对HSV颜色空间进行了分析,并给出了量化公式.张磊的量化算法同时考虑了H、S和V上的不等间隔量化,将近似的颜色更好地“聚”在一起。但这种算法是一种硬划分。如果两种看似很相近的颜色的某一分量恰好处于量化区间的分界处,则很容易被分成两类。为解决这一问题,本研究在张磊算法的基础上,引入模糊理论,对量化分界点进行模糊划分。
扎德(L.A.Zadeh)于1965年提出了模糊集合的概念[ Zadeh L A. Fuzzy sets[C].Information and Control,1965:338-353.],他用隶属函数(Membership Function)来刻画处于中介过渡的事物对差异双方所具有的倾向性。隶属函数被认为是普通集合中特征函数的推广。
论域X上的模糊集合由隶属函数来表征,其中 在实轴的闭区间[0,1]上取值,的值反映了X中的元素x对于的隶属程度。模糊集合完全由隶属函数所刻画。的值接近1,表示x隶属于的程度很高;的值接近于0,表示x隶属于的程度很低;当的值域为{0,1}二值时,演化为普通集合的特征函数,便演化成一个普通集合A。
在模糊划分(Fuzzy Partition)高新波.模糊聚类分析及应用[M].西安:西安电子科技大学出版社,2004:9-10.]中,样本集X被划分为C个模糊子集,,…,,而样本的隶属函数uik的值域由0,1两个离散值扩展到[0,1]区间,满足:
(1)
根据以上理论,对HSV空间中的任一颜色分量,设量化分界点为Ti,Ti两边的量化区间为和,此分界点附近的模糊区间为[-€%^,€%^],量化数据xi到分界点的距离为di,则当时,此量化数据的隶属函数uik取值为:
即可认为有部分属于 ,有部分属于。
对于处于分界点附近颜色的一个分量,本研究可将其模糊量化到两个分量区间。因此,在三维HSV空间里,一种颜色可能会被模糊量化到2K(K∈[0,3])个不同的区间,通过隶属部分的计算,可得到此颜色在每个量化区间中所占的比例。在用图像色彩直方图统计时,再将此颜色在图像中所占比例根据隶属关系分配到各个量化区间,得到模糊量化后的色彩直方图,为图像的相似性度量提供数据基础。
三、基于一维HSV颜色模型的二次模糊聚类
本研究在实验中发现,用上文中所介绍的量化方法进行颜色量化时,存在的问题是,位于不同量化级的颜色实际上的差别可能很小,它们应该属于同一种颜色。产生问题的原因在于人眼对颜色的感知受视觉特征的影响,对图像中颜色的某些分量并不敏感,另外,人对颜色的心理认知通常也很模糊,比如“红”色,虽然“红”色本身有很多种,比如深红,浅红,亮红,但在颜色差别不是很大的情况下,人们心理上还会认为这些颜色都是红色。并且,对于大多数人来说,对“红”色的认识是一种心理的感觉,难以用语言精确描述,只有当眼睛看到红色时,才会认知红色。本研究正是在对这些视觉特征和图像进行实验的基础上做了二次聚类,聚类结果具有一定的模糊性,本研究因此称之为二次模糊聚类。
因为人对颜色认知具有的模糊性,笔者认为人们经常用来描述颜色的词语可以被认为是人们对常用颜色的心理认知和聚类。为此,笔者设计如下实验:
实验在上文所用图库进行。本研究通过统计日常生活中常用颜色,将常用颜色分为红、橙、黄、绿、青、蓝、紫、黑、白、灰、褐、棕12种。笔者邀请30位本科学生参与实验,要求他们在图像库中找出自己认为主色调是红、橙、黄、绿、青、蓝、紫、黑、白、灰、褐、棕12种颜色中任意一种颜色的图像,并将找到的图像按照这12种主色类别分类,对于实验参与者不能够确认主色调或者不明确主色调是哪种颜色的图像,不要求分类。这样做的目的在于让实验参与者能够依据自身对颜色的心理认识对图像分类,找到最能够反映以上12种颜色类别的图像。得到分类结果后,笔者按照上文提出的量化算法对图像颜色量化,取出每幅图像中颜色含量最高的颜色,最后按照颜色类别对该类别中每幅图像含量最高的颜色进行统计,如果出现频率高的颜色只有一个,就以此颜色作为此种颜色类别的代表色;如果出现频率高的颜色有多个,那么将这多个颜色合并成一个,代表该颜色类别。
按照上文所提出的量化算法对图像颜色量化,得到基于36维颜色直方图。
经过统计每个颜色直方图中最大值出现的频率发现,颜色值为29,30,31的三个颜色远远高于其他颜色出现的次数,即实验参与者认为颜色值为29、30、31所代表的颜色为蓝色。因此,本研究将这三种颜色归为一类,即“蓝色”,这就完成了此种颜色的二次聚类。
四、结语
本研究所提出的量化算法,不仅考虑到了在HSV空间中对颜色各个分量不等间量化,对量化边界进行了模糊化处理,使颜色量化结果更加接近人类视觉模型,而且考虑到人的视觉特征对颜色的影响和心理对颜色的认知,使量化将近似的颜色更好地聚集在一起,基本解决了其他方法中颜色值冗余的问题,将颜色量化为23色,相应的直方图维数也降为23维,大大降低了运算和存储的复杂度。
【关键词】色彩空间;颜色量化;模糊聚类
一幅彩色图像包含多种颜色,如果直接提取图像的颜色特征,存储量和计算量将非常大。所以,在提取颜色特征之前,为了减少颜色特征的维数,通常先对颜色进行量化。颜色量化效果的好坏,将直接影响检索结果的精度。本研究将结合基于HSV色彩空间的量化和基于色彩频度的量化思想,提出一种新的颜色量化算法。
一、量化算法的基本思想
由于颜色空间本身的连续性,一幅彩色图像包含多种颜色,如果直接提取图像的颜色特征,存储量和计算量将非常大。所以,为了减少颜色特征的维数,通常在提取颜色特征之前先对颜色进行量化。量化的基本思想是以量化点颜色为轴心,把与该颜色相似的颜色归并到这一类,在最低平均方差下聚类出最少数目的颜色。[ keun-Chang Kwak,Witold Pedrycz.Face Recoion Lgnition: A Study in Information Fusio Using Fuzzy Intergral[J].Pattern Recognition Leters,2005(26):719-733.]一次量化算法产生的颜色类别较多,结果并不适合实际颜色情况,如“黄”色,在实际生活中可能反映为浅黄、深黄、橘黄等,这几个应该聚为一类的颜色在初次聚类时可能被分成了几类。因此,本研究将采用颜色量化最常用的HSV色彩空间和张磊的量化思想[ Zhang Lei,Lin Fuzong,Zhang Bo. A CBIR Method Base on Color-Spatial Feature[A].IEEE Region 10 Annual International Conference 1999,Cheju,Korea,1999:166-169.],结合模糊理论的相关思想,针对不同颜色之间存在的相似性,设计一种新的颜色量化算法。此过程分两步完成:(1 )改进张磊提出的量化算法,完成一次量化。(2)基于实验的二次模糊聚类。
一次量化算法产生的颜色类别较多,结果并不适合实际颜色情况,如“黄”色,在实际生活中可能反映为浅黄、深黄、橘黄等,这几个应该聚为一类的颜色在初次聚类时可能被分成了几类。因此,本研究将借助大量的图像进行实验,最后完成符合颜色表现特点的量化。由于这个过程是通过用大量的实际图像进行实验得到,因此量化结果具有很高的可信度,也是最切合实际的做法。
二、 基于边界模糊化的量化算法
基于人类视觉对颜色的感知特性,张磊对HSV颜色空间进行了分析,并给出了量化公式.张磊的量化算法同时考虑了H、S和V上的不等间隔量化,将近似的颜色更好地“聚”在一起。但这种算法是一种硬划分。如果两种看似很相近的颜色的某一分量恰好处于量化区间的分界处,则很容易被分成两类。为解决这一问题,本研究在张磊算法的基础上,引入模糊理论,对量化分界点进行模糊划分。
扎德(L.A.Zadeh)于1965年提出了模糊集合的概念[ Zadeh L A. Fuzzy sets[C].Information and Control,1965:338-353.],他用隶属函数(Membership Function)来刻画处于中介过渡的事物对差异双方所具有的倾向性。隶属函数被认为是普通集合中特征函数的推广。
论域X上的模糊集合由隶属函数来表征,其中 在实轴的闭区间[0,1]上取值,的值反映了X中的元素x对于的隶属程度。模糊集合完全由隶属函数所刻画。的值接近1,表示x隶属于的程度很高;的值接近于0,表示x隶属于的程度很低;当的值域为{0,1}二值时,演化为普通集合的特征函数,便演化成一个普通集合A。
在模糊划分(Fuzzy Partition)高新波.模糊聚类分析及应用[M].西安:西安电子科技大学出版社,2004:9-10.]中,样本集X被划分为C个模糊子集,,…,,而样本的隶属函数uik的值域由0,1两个离散值扩展到[0,1]区间,满足:
(1)
根据以上理论,对HSV空间中的任一颜色分量,设量化分界点为Ti,Ti两边的量化区间为和,此分界点附近的模糊区间为[-€%^,€%^],量化数据xi到分界点的距离为di,则当时,此量化数据的隶属函数uik取值为:
即可认为有部分属于 ,有部分属于。
对于处于分界点附近颜色的一个分量,本研究可将其模糊量化到两个分量区间。因此,在三维HSV空间里,一种颜色可能会被模糊量化到2K(K∈[0,3])个不同的区间,通过隶属部分的计算,可得到此颜色在每个量化区间中所占的比例。在用图像色彩直方图统计时,再将此颜色在图像中所占比例根据隶属关系分配到各个量化区间,得到模糊量化后的色彩直方图,为图像的相似性度量提供数据基础。
三、基于一维HSV颜色模型的二次模糊聚类
本研究在实验中发现,用上文中所介绍的量化方法进行颜色量化时,存在的问题是,位于不同量化级的颜色实际上的差别可能很小,它们应该属于同一种颜色。产生问题的原因在于人眼对颜色的感知受视觉特征的影响,对图像中颜色的某些分量并不敏感,另外,人对颜色的心理认知通常也很模糊,比如“红”色,虽然“红”色本身有很多种,比如深红,浅红,亮红,但在颜色差别不是很大的情况下,人们心理上还会认为这些颜色都是红色。并且,对于大多数人来说,对“红”色的认识是一种心理的感觉,难以用语言精确描述,只有当眼睛看到红色时,才会认知红色。本研究正是在对这些视觉特征和图像进行实验的基础上做了二次聚类,聚类结果具有一定的模糊性,本研究因此称之为二次模糊聚类。
因为人对颜色认知具有的模糊性,笔者认为人们经常用来描述颜色的词语可以被认为是人们对常用颜色的心理认知和聚类。为此,笔者设计如下实验:
实验在上文所用图库进行。本研究通过统计日常生活中常用颜色,将常用颜色分为红、橙、黄、绿、青、蓝、紫、黑、白、灰、褐、棕12种。笔者邀请30位本科学生参与实验,要求他们在图像库中找出自己认为主色调是红、橙、黄、绿、青、蓝、紫、黑、白、灰、褐、棕12种颜色中任意一种颜色的图像,并将找到的图像按照这12种主色类别分类,对于实验参与者不能够确认主色调或者不明确主色调是哪种颜色的图像,不要求分类。这样做的目的在于让实验参与者能够依据自身对颜色的心理认识对图像分类,找到最能够反映以上12种颜色类别的图像。得到分类结果后,笔者按照上文提出的量化算法对图像颜色量化,取出每幅图像中颜色含量最高的颜色,最后按照颜色类别对该类别中每幅图像含量最高的颜色进行统计,如果出现频率高的颜色只有一个,就以此颜色作为此种颜色类别的代表色;如果出现频率高的颜色有多个,那么将这多个颜色合并成一个,代表该颜色类别。
按照上文所提出的量化算法对图像颜色量化,得到基于36维颜色直方图。
经过统计每个颜色直方图中最大值出现的频率发现,颜色值为29,30,31的三个颜色远远高于其他颜色出现的次数,即实验参与者认为颜色值为29、30、31所代表的颜色为蓝色。因此,本研究将这三种颜色归为一类,即“蓝色”,这就完成了此种颜色的二次聚类。
四、结语
本研究所提出的量化算法,不仅考虑到了在HSV空间中对颜色各个分量不等间量化,对量化边界进行了模糊化处理,使颜色量化结果更加接近人类视觉模型,而且考虑到人的视觉特征对颜色的影响和心理对颜色的认知,使量化将近似的颜色更好地聚集在一起,基本解决了其他方法中颜色值冗余的问题,将颜色量化为23色,相应的直方图维数也降为23维,大大降低了运算和存储的复杂度。