论文部分内容阅读
白细胞图像分割与识别是医学图像处理中的重要组成部分。血液中的白细胞对于人体免疫功能非常重要,可以协助免疫系统修复受伤部位,消灭病原、病菌和微生物等。各类白细胞的数量体现了人体免疫系统的水平,在临床血常规检验中,医师通过观察不同类别白细胞的数量、所占比例及其形态变化来诊断造血系统疾病。因此,防止白细胞数量的异常增加或减少,可以预防感染性疾病的细菌和病毒的入侵,精准分割白细胞对于计数和识别分类是至关重要的。白细胞形态学自动识别系统是一个自动化的镜检系统,即通过图像处理和模式识别的算法实现白细胞的分割和识别。由于白细胞种类繁多,并且其在血涂片中的形态多样,白细胞分割和识别是一个富有挑战的问题。然而,基于卷积神经网络(Convolutional Neural Network,CNN)的深度学习算法擅于提取高维数据中的特征信息,并且不需要进行特征提取与重建过程。本文重点结合CNN模型,研究白细胞的精准分割和分类。血涂片图像中主要是白细胞、红细胞和血小板。基于深度学习算法,本篇论文介绍了一种精准分割粘连白细胞的方法,即将属于白细胞的像素点置于前景,其他像素点置于背景。由于白细胞与红细胞在颜色上存在差异,本文提出了基于色彩空间变换的目标检测方法提取白细胞,即将急性淋巴细胞白血病(Acute Lymphoblastic Leukemia,ALL)患者的血涂片图像由RGB色彩空间转换至HSV,根据白细胞的颜色特性滤除红细胞。由于血小板的尺寸远小于白细胞,同时将面积较小的目标滤除,从而保留白细胞。而后,对于提取结果中的粘连白细胞,本文提出了多类加权损失函数的深度学习算法精准分割白细胞。将白细胞边界设定为除细胞内部区域和背景区域外的第三类,基于类别权重和距离变换权重为每张样本生成其对应的权重图,并将其应用于交叉熵损失函数以提高细胞边界的权重,从而加强CNN模型在拟合训练集的过程中对细胞边界特征的学习。在白细胞分类验证的过程中,由于样本数量匮乏,本文引入了L2正则化、批标准化(Batch Normalization,BN)和Dropout三大机制来避免过拟合现象,从而提高CNN模型的泛化能力。本文提出的白细胞精准分割方法于数据集ALL_IDB1上进行了充分实验,测试集准确率达到97.92%,与其他算法相比具有优越性。另外融合Kaggle_Dataset和BCISC数据集进行白细胞分类,证明了引入的避免过拟合机制可以提升模型的鲁棒性。