论文部分内容阅读
近年来,大数据技术及其相应的研究已经成为计算机科学、物理学、生物学以及环境生态学等各个领域的研究热点,而应用持续同调来分析各种大数据是现今备受关注的研究方法之一.以往的图像分类和识别的研究对发生了旋转变换、投影变换以及非线性变换的图像的处理存在一定的局限性.本文主要研究应用持续同调的方法对图像数据做定性分析,提取图像的拓扑不变特征,并探讨将图像的拓扑特征应用在图像的分类和识别工作中的可行性.本文应用持续同调的方法,构建了一系列连续参数下的单纯复形来逼近图像空间,再计算这些复形的同调信息并将它们写入“条形码”中.在这个连续逼近的过程中,我们不但可以得到图像的拓扑不变特征,并且还可以得到部分与图像空间拓扑结构相关的几何特征.通过简单的几何图像和简单的自然图像的实验得出,我们可以用图像的拓扑不变特征来分析图像之间的相似性,用图像的几何特征分析图像之间的差异性.特别地,通过对比不同角度下拍摄的图像之间拓扑结构和几何结构的相似性和差异性,我们得出拓扑不变特征能比较理想地判别出在一定程度上发生了形变的图像与原图像之间的相似性(如拍摄角度、远近的变化而使图像发生的偏转、旋转、反转、放缩以及遮挡等).为了能够运用图像的拓扑特征定量地分析两个图像之间的相似性和差异性,本文构造了几种条形码之间的距离,用条形码之间的距离来表示相对应的图像之间的距离.通过对简单几何图像进行实验对比,我们分析了这几种距离的优点和不足,并验证了持续同调的方法对产生了比例变化、旋转变换、非线性变换以及遮挡等图像的分类和识别工作有较大的优势.由于条形码的中部的信息更接近真实信息,为了凸显出这部分信息的重要性,我们对条形码的距离进行加权处理.加权后的条形码的距离,能更好地区分拓扑结构相近的图像,为后续我们分析复杂的自然图像奠定基础.