论文部分内容阅读
在组织病理学图像分析中,上皮组织-基质分离是不可或缺的预处理步骤。目前的分割方法将分割问题转变为模式识别的分类问题,而将传统的深度学习方法用于识别组织学数据时,若出现了新的待处理数据,为了训练一个新的神经网络,需要收集大量的有标数据。然而,倘若每个病理学研究都需要人工标注充足的标签数据,其成本十分昂贵,这就限制了此方法在现实生活中的应用。鉴于获取无标组织病理学图像成本很低,本文针对上皮组织-基质分类问题,提出了两种基于卷积神经网络与迁移学习的分类方法。本文的主要研究内容及成果如下:1.提出了一种基于卷积神经网络与自学习相结合的方法用于上皮组织-基质分类。本文将两个独立的乳腺癌组织病理学图像数据集和网上下载的一些组织病理学图像作为辅助数据(源域数据),并且卷积神经网络中的卷积核通过自学习字典中的原子确定。由于自学习中的字典学习是基于图像重建的,因此我们使用主成分分析(PCA)作为其简化版本。最后,利用支持向量机(SVM)实现结果的二分类。实验表明,随着有标训练数据比重的急剧下降,本文的方法比传统的卷积神经网络的方法效果更佳。2.提出了一种基于卷积神经网络与域自适应相结合的方法用于上皮组织-基质分类。通过域自适应的方法来更准确地估计卷积神经网络中的卷积核。鉴于传统的卷积神经网络的低层特征本身具有一定的域自适应性,本文的域自适应操作只针对高层特征。实验表明,本文的框架胜过目前最优的深度神经网络模型,与其它现有的深度域自适应方法相比,其性能也更好。本文方法能够很好地解决实际应用中出现的小标签样本或样本无标签的问题。其中,自学习方法可以将大量无标的公开组织病理学图像作为辅助数据,然后将从辅助数据上学到的知识迁移到所处理的实验数据上,从而在有标训练数据有限的情况下提高分类性能。而域自适应方法只要求源域数据包含标签,目标域中数据的标签信息则可有可无,这便大大降低了待处理领域对有标数据的需求。