论文部分内容阅读
癌症是造成世界上人类死亡的主要原因,其中结肠癌患者数量多且死亡率较高,它已经成为影响人类生命的第三大危险癌症,但其早期诊断成活率只有50%。因此,对结肠癌进行准确的早期诊断与分析具有重要的研究价值和意义。近年来,通过自动化分析结肠癌图像细胞核进行早期诊断已有一些研究成果,但存在手动提取特征误差大、诊断精确度低等问题。随着深度学习的不断发展,卷积神经网络可以直接对原始图像提取特征,从而在医学图像处理方面取得了重大突破。但是,由于其自身存在训练耗时以及结肠癌图像细胞核自身高度的异质性,致使以往的一些方法很难对结肠癌图像细胞核进行高效的分类。针对以上问题,本文首先从卷积神经网络的内部结构出发,研究了全连接层对卷积神经网络性能的影响以及数据集与网络之间存在的潜在关系;提出了重叠聚类的卷积模型来提高网络的训练速度;参考全连接层对卷积神经网络性能影响的实验设置,提出了基于聚类卷积的结肠癌图像细胞核分类新方法。论文的主要研究内容如下:(1)研究了全连接层对卷积神经网络性能的影响。本文提出了三种由浅到深的初始网络架构依次为Net-1、Net-2及Net-3。通过逐渐增加全连接层单层中神经元的个数来研究神经元对于卷积神经网络性能的影响;进而通过逐渐增加全连接层层数的方式研究全连接层的层数对卷积神经网络性能的影响;最后通过实验分析了数据集与卷积神经网络之间存在的潜在关系。在CRCHistoPhenotypes、CIFAR-10、CIFAR-100和Tiny ImageNet四个数据集上的实验结果表明,深层的网络不需要在全连接层中拥有更多的神经元以及全连接层层数,而浅层的网络需要;对于数据集而言,深度的数据集需要更深的网络进行训练。并且,当Net-3的全连接层神经元数被更新为128和4时,在CRCHistoPhenotypes上获得了84.79%的分类精度。(2)提出了基于聚类卷积的结肠癌图像细胞核分类新方法。在参考全连接层对卷积神经网络性能影响的实验设置之后,本文把对结肠癌图像细胞核分类性能最好的Net-3网络作为基准网络。然后,结合受限玻尔兹曼机模型和基于KHM-OKM(K-Harmonic Means And Overlapping K-Means Algorithms)的重叠聚类学习方法,提出了重叠聚类的卷积模型,并将该模型用于结肠癌图像细胞核分类模型的预处理,来改善卷积神经网络训练耗时的问题。最后,结合新的dropout模型和残差模型,提出了基于聚类卷积的结肠癌图像细胞核分类新方法,该方法不但降低了网络训练的时间,而且在结肠癌图像细胞核上达到了85.98%的分类精度。为了验证该方法的泛化能力,在CIFAR-10、CIFAR-100以及Tiny ImageNet三个数据集上也进行了实验并做了分析。