论文部分内容阅读
近年来,随着计算能力和电子存储能力的不断提高,图像和视频形式的数字内容呈现指数上升趋势,尤其是互联网上大量使用的数字图像和视频构成了娱乐、教育和商务应用的基础。如何有效管理快速扩张的视觉信息已演变成一个亟待解决的问题,人们意识到需要一种基于图像自身内在特性的、有效而直觉性的方法来表示和检索图像,这种需求迫使基于内容的图像检索技术应运而生。图像检索即意味着在数字图像数据中的一种搜索行为。每个图像数据集合都是不同的,都拥有各自不同的特质。基于内容的图像检索技术是指运用诸如颜色、纹理、形状、空间布局之类图像自身内在的视觉内容来表示和索引图像的一种技术。这种技术可以自动提取数据库中图像的视觉特征,并用多维特征向量表示,这些特征向量组成一个特征库;系统将用户提供的查询示例图或草图转换成特征向量的内部表示方式;计算查询示例图特征向量与数据库图像特征向量之间的相似性测度,并辅之以一定的索引方案执行检索;该索引方案应提供搜索数据库图像的有效方式。在数据库和计算机视觉两大研究领域的共同推动下,20世纪90年代以来,基于内容的图像检索技术已成为一个非常活跃的研究领域。独立分量分析是一种新兴的信号处理和数据分析方法,它是将复杂数据集合分解为独立子集的一种通用意义上的统计计算技术,是涉及统计学、信号处理、神经网络、信息论、人工智能、工程学等的一门综合交叉性学科。在独立分量分析模型中,假设数据变量是一些潜在的未知变量的线性或非线性组合,假设混合系统也未知,假设这些潜在的未知变量是非高斯的且相互统计独立,人们把这些潜在的未知变量称作观测数据的独立分量、信源或因子,独立分量分析的目标就是仅仅通过给定的传感器观测数据来恢复独立信源。主分量分析与独立分量分析一般都是运用线性坐标系统来表示多变量数据集合的方法,都属于无监督、自适应成分分析法。与主立分量分析不同的是,独立分量分析不仅可以去除信号的二阶统计相关性,而且可以降低其高阶统计相关性,使得信号尽可能的相互统计独立。换言之,独立分量分析是在任意多变量数据中寻找线性非正交坐标系的一种方法,可以视作是主分量分析的一种拓展。近年来,围绕着独立分量分析的科研活动蓬勃展开,在语音信号处理、生物医学信号处理、图像去噪、图像检索、通信、股市预测等领域得到广泛的应用。特征定义为由图像提取的描述性参数,可以运用特征对图像内容作出解释,或者将特征作为图像数据库的相似性测度。特征提取是图像检索研究的最基本的问题之一,无论是基于特定领域的视觉内容、基于通用视觉内容还是基于语义内容的图像检索,提取有效的鉴别特征是解决检索问题的关键。基于内容的图像检索在图像分析中是一项极具挑战性的工作,这项工作之所以艰巨是因为它受限于对内容描述和提取基本图像特征之间关系的理解。一个良好的视觉内容描述特征对于图像成象过程中所引入的非主流变化(如场景的亮度变化等)应具有不变性。应该指出,并不存在适合于所有图像领域的“最佳特征”,对于特定领域的应用,多特征运用往往可以使问题得到一个不错的解答。近来的研究表明,在实施数字内容分析时,运用图像的统计特征可以提高系统的存储能力。通过无监督成分分析法可以直接提取图像的底层视觉特征。基于高阶统计特性的独立分量分析可以提取局域性、方向性和带宽性特征,并改善图像的聚类效果。本论文在介绍了图像检索和独立分量分析的发展历史、研究现状和实际应用之后,围绕基于内容图像检索的一些关键技术,包括提取图像底层特征、图像间的相似度度量、相关反馈等技术进行了一些探索性的研究,研究的内容属于目前图像处理和信息检索领域的研究重点,具有相当的理论意义和实际应用价值。对独立分量分析理论基础进行了简单描述,包括独立分量分析的数学定义、基本假设、相关的数学理论基础和实现途径等;然后针对一些独立分量分析的算法和应用问题进行了深入的研究。本论文以计算数据集合优势特性的独立分量分析为主要数学工具,应用独立分量分析进行数据空间转换,可以有效提高系统的存储能力;提取基于独立分量分析的特定领域视觉内容、通用视觉内容和数字水印标注语义的内容特征,并采取适当的特征融合,提出一系列基于独立分量分析的图像检索方案。论文的主要贡献概括如下;1.扫描脸部图像所得到的人脸数据构筑成一个高维信号空间,然而无论描述姿势还是亮度等方面的变化,反映到人脸信号空间的固有维数是很小的,即人脸由低维多种特征聚集而成。论文中提出一种基于独立分量分析的内容特征,并用于人脸图像检索,得到一种基于内容的图像检索方案。该方案首先在降维空间提取出基于高阶统计特性的主独立内容特征,应用提取的主独立内容特征进行有效的人脸图像描述。携带局域性突出特征信息的主独立内容特征更逼近于图像的小边缘或图像信用空间的细节,不仅适用于正面人脸图谱检索,在含有一定角度的倾斜与旋转变化的人脸图谱检索中更显示出它的优越性。2.在人脸图像检索阶段提出一种基于主独立内容特征的相似性测度,以确保计算的有效性和检索的正确率。运用主独立内容特征的相似性测度经二次检索后,可增强系统的检索性能。实验结果表明这种方法的检索性能优于主分量分析法以及使用普通测度的独立分量分析法。3.在基于主独立内容特征的检索方法中,运用一种可消除独立特征顺序不确定性的算法,从众多的主分量和独立分量中选出具有识别能力的独立分量,以进一步提高计算的有效性和检索正确率,计算机仿真结果验证了所提出方法的有效性,平均查准率可达95.14%/千次。4.提出一种基于分类图像颜色和纹理特征的,结合分块、主分量分析和独立分量分析的图像检索方法。实验研究表明;可以提供无监督数据群的特征与人类的视觉感知具有良好的一致性,能够较好地描述图像的颜色内容,而且所提出特征对于图像成象过程中引入的非主流变化具有良好的不变性。通过实验比较,证明HSV颜色空间最有效;在分类图像子空间中,所提出的颜色特征具有尺度和旋转不变性,它与方向性纹理特征具有良好的互补性,其组合特征可有效地改善检索效果。5.医疗信息系统的目标定义为在正确的时间、正确的地点及时传送给正确的人所要的信息,同时提高治疗过程的质量和效率。一些有价值的结构性信息(如患者的年龄、性别和职业等)可以储存在实际图像中,而且一种好的包含有客观知识的医学图像标注图集是的确存在的。因此将视觉特征与文本相结合的方法在医学图像检索中更具有应用价值。本文提出一种融合数字水印标注的独立内容特征,并应用于医学图像检索。用于描述医学图像的内容特征是运用独立分量分析法在降维空间提取的,该种特征雇佣了训练图像的局域性内容描述信息。数字水印是一种物理不可见的数据改动,从中可以嵌入患者的结构性信息并用于医学图像检索,如此,可以确保医学图像的完整性以及患者电子病历的个人隐私权。运用X光口腔照片的仿真实验验证了所提出方法的有效性,所采用的数字水印算法对JPEG压缩具有良好的鲁棒性。图像检索的研究历史不过短短数十年,独立分量分析技术也只是在近几年才开始应用于这一领域,虽然能够为图像检索技术的发展提供新的见解和思路,但仍有许多问题需要并值得继续进行探索和研究。本文以独立分量分析为主要数学工具,将基于图像象素的统计分析与基于特征的分析和提取相结合,提取基于独立分量分析的各种视觉内容特征,并应用于图像检索。具体提取基于独立分量分析的特定领域视觉内容特征,并成功地运用于人脸图像检索;在类内图像子空间,将基于无监督成分分析法的通用颜色内容特征与纹理特征相融合,应用于彩色图像检索,可以进一步增强图像的检索效果;提取基于独立分量分析的内容特征并与数字水印标注语义信息内容相结合应用于医学图像检索,可以在确保查准率的前提条件下,保证医学图像的完整性以及患者电子病历的个人隐私权。论文最后总结了图像检索研究中有待于解决的问题,并强调指出了下一步的研究重点。