论文部分内容阅读
随着计算机技术的发展,在医学领域中图像识别的应用日益广泛。在癌细胞自动识别方面,已经出现了很多的细胞识别算法,但是由于细胞图像的多样性和复杂性,直到目前为止还没有一种算法是完善的。本文采用支持向量机来进行图像的分割,采用图像矩作为细胞图像的特征,以支持向量机作为分类识别的工具,以鳞癌细胞作为识别对象,尝试建立一种通用的算法,用来进行多种细胞的识别。采用矩作为图像特征是因为图像矩具有多畸变不变性,当图像进行旋转、缩放、平移等变化时,作为图像特征的矩可以保持不变。图像矩最先是由Hu在1961年首先提出的,并给出了一组规格化的几何矩,它们的优点是在描述图像时具有多畸变不变性,缺点是很难用几何矩恢复图像;以后在图像矩的研究领域还出现了旋转矩、复数矩、Legendre矩、Zernike矩等,在这些图像矩中,Zernike矩的图像描述效果最好,抗噪声能力最强。但是Zernike矩的缺点是对小图像的描述性能不好;盛云龙等在1994年提出了正交傅里叶-梅林矩,它在描述大图像时具有和Zernike矩相似的性质,但在描述小图像时比Zernike矩具有更为优越的性能。此后平子良等提出了切比雪夫-傅里叶矩,它和正交傅里叶-梅林矩有相似的性质。随后,平子良等在2007年又提出了雅可比-傅里叶矩,并指出采用径向多项式构造的Legendre矩、Zernike矩、切比雪夫-傅里叶矩、正交傅里叶-梅林矩都是雅可比-傅里叶矩的一种特殊形式,它们都可以通过在雅可比矩中采用不同的参数得到。2003年,任海萍等利用三角函数构造出了图像描述性能最为优越的矩:圆谐傅里叶矩。本文在此基础上对圆谐傅里叶矩作了深入的探讨,并给出它的一般形式:指数-傅里叶矩,它比采用三角函数构建的圆谐傅里叶矩具有更为优越的对图像的描述性能。在所有具有多畸变不变性的图像矩计算中都存在一个问题:为了使图像矩具有多畸变不变性,所有的图像矩都是在极坐标系下定义和计算的,而所有的图像都是以直角坐标系作为参照系在计算机中保存的。要计算图像的矩,就必须把图像转换到离散的极坐标系下。而利用图像矩重建图像时则是在极坐标系下重建图像后再转换到直角坐标系中。这种转换过程不仅极大的增加了计算的负担,而且在转换过程中会出现插值误差。为了解决这些问题,本文探讨了在直角坐标系下直接计算具有多畸变不变性图像矩的方法以及用图像矩在直角坐标系下重建图像的方法。在得到图像的特征后,利用支持向量机在特征空间中找到一个最优分类面,然后用此分类面来进行图像的分类。至此,可以得到一个通用的细胞识别算法,它从细胞的分割、特征提取到细胞识别的算法都是通用的。在针对细胞图像识别的研究过程中,取得成果如下:1、提出了在直角坐标系下利用图像矩直接重建图像的方法。在现有的文献中利用图像矩重建图像时都是在极坐标系下进行的,重建的图像还要转换到直角坐标系下。本文在第三章中首次提出了利用图像矩直接在直角坐标系下重建图像的方法,从而避免了图像的坐标转换,以及由坐标转换带来的误差,提高了计算的速度和精度。2、在现存的各种具有多畸变不变性图像矩中,以任海萍等人提出的圆谐傅里叶矩对图像的描述性能最好。本文第四章在对圆谐傅里叶矩研究的基础上发现,任海萍等人提出的圆谐傅里叶矩仅仅是一种特殊的形式,还存在有许多其它形式的、性能一样的圆谐傅里叶矩。3、提出了一种性能更好的图像矩:指数-傅里叶矩。在对圆谐傅里叶矩研究的基础上,在第四章中导出了指数-傅里叶矩。指数-傅里叶矩具有任海萍等人提出的圆谐傅里叶矩相同的图像描绘性能,但是它的形式更简洁,且计算速度更快。这是迄今为止已知的性能最好的图像矩。4、提出了在直角坐标系下计算具有多畸变不变性正交图像矩的方法。在现有的文献中,为了保证图像矩具有多畸变不变性,对图像矩的计算都是在极坐标系下进行的。由于图片都是以直角坐标系为参照系来进行保存的,在计算的过程中需要进行坐标的转换,但是这样会导致出现插值误差,并且极大的增加计算负担。本文第五章提出了在直角坐标系下计算具有多畸变不变性图像矩的方法,使得在计算图像矩的过程中不必再进行图像像素坐标的转换,不仅极大的提高了图像矩的计算速度,而且彻底的避免了因坐标转换带来的误差。5、在第六章中,本文利用指数-傅里叶图像矩作为特征,利用支持向量机来寻求最优分类面,构建了一个通用的、自动化的识别算法。由于细胞形态的多样性,对不同类型的细胞要设计不同的特征提取算法和分类方法。但是对所有的图像矩的计算中,算法都是一样的,因此采用图像矩作为特征,可以为不同的识别对象设计出通用的识别系统。