论文部分内容阅读
研究背景:越来越多的断层扫描检查导致偶然发现的小肾肿瘤(small renal masses,SRMs)日益增加,这些小肾肿瘤已成为很常见的临床问题。目前小肾肿瘤的定义为影像检查中最大直径不超过4cm的强化肿瘤。这些小肾肿瘤中80%为肾细胞癌(renal cell carcinoma,RCC),从临床角度出发,最重要的有三种肾细胞癌:肾透明细胞癌(clear cell RCC,ccRCC)最多见,占肾细胞癌总数的80-90%;乳头状肾细胞癌(papillary RCC,pRCC),可分为I型和II型,占肾细胞癌总数的10-15%;肾嫌色细胞癌(chromophobe RCC,chRCC),占肾细胞癌总数的4-5%。余下的20%小肾肿瘤为良性肿瘤,其中肾血管平滑肌脂肪瘤(angiomyolipoma,AML)最常见。当影像检查偶然发现小肾肿瘤时,对临床的挑战包括肾脏良恶性肿瘤之间的鉴别以及肾脏恶性肿瘤的最佳治疗选择。传统的肾脏肿瘤影像检查方法包括超声检查,电子计算机断层扫描(computed tomography,CT)检查以及核磁共振成像(magnetic resonance imaging,MRI)检查。大多数的肾脏肿瘤可以通过影像学检查正确诊断,但是CT和MRI并不能可靠地鉴别乏脂肪AML(fat-poor angiomyolipoma,fp-AML)和肾脏恶性肿瘤,同时也无法预测肾脏恶性肿瘤的生物学侵袭性。肾脏穿刺活检术在一定程度上可以认为是鉴别诊断肾脏肿瘤组织学类型的金标准,但其作为有创检查,可能会对患者造成一定程度的危险并增加患者额外的经济负担。考虑到目前传统影像学检查方法和肾脏活检穿刺术的局限性,开发一种全新的能够准确且无创的对肾脏肿瘤病理组织学类型进行预测的技术将具有很大的临床价值。深度学习,作为机器学习的一个分支,最近在计算机视觉、图像分类、语音识别、自然语言处理和游戏开发等多个领域取得了显著的进步。卷积神经网络是深度学习方法中最典型的人工神经网络系统,它的架构由许多“层”组成,每层有大量类似神经元的节点相连接。众所周知,卷积神经网络中的卷积层中有多种类型的卷积核,它对图像特征的识别极其有效。传统的机器学习算法在学习之前需要先从图像中提取特征,而深度学习中卷积层是在学习过程中自动挖掘图像数据的特征。因此,同传统的机器学习受限于人类特定领域知识设计的手工特征不一样的是,基于卷积神经网络的深度学习方法能够使用图像本身包含的所有信息,这是深度学习方法的核心优势。通过这种学习方式,基于卷积神经网络的深度学习方法很快被医学影像领域所采用,并应用在分类,探测和分割等多种影像学图像处理任务中。因此这一方法具备在动态增强CT图像上鉴别肾脏肿瘤病理分类的潜能。第一部分基于MSCT的深度卷积神经网络鉴别乏脂肪肾血管平滑肌脂肪瘤与肾癌研究目的:使用基于卷积神经网络的深度学习方法,通过四期动态增强CT图像,构建卷积神经网络模型用于鉴别乏脂肪肾血管平滑肌脂肪瘤与肾癌,并评价模型的性能。研究方法:这一回顾性单中心研究由医院伦理委员会批准。所有乏脂肪肾血管平滑肌脂肪瘤与肾癌患者均在我院病理科电子档案库中查询得到,时间为2013年1月至2017年7月。共200位患者纳入研究中,其中包括42名乏脂肪肾血管平滑肌脂肪瘤患者,158名肾癌患者。这200位患者由124位男性患者与76位女性患者组成,平均年龄55.07岁,年龄范围20-83岁。所有患者均使用设备320排容积CT进行肾脏四期规范化扫描,流程包括:平扫期、皮髓质期、实质期和排泄期。预处理的第一步就是对每张CT图像中的肿瘤区域进行分割以及分割后的非肿瘤区域的背景去除。该研究采用人工的肿瘤整体分割法,所有患者的分割工作由一位影像科医师进行,该医师对所有患者信息均不知情。平扫图像上的肾脏肿瘤边界由该医师与另外一名医师使用相应层面的三期增强图像共同商量后决定。所有去除非肿瘤背景后的肿瘤图像将用于卷积神经网络模型的构建。200位患者的12317张分割图像(平扫期786张,皮髓质期3854张,实质期3900张,排泄期3777张)用于实验研究。预处理的第二步是在上一步得到的肿瘤分割图像中截取肿瘤部分,将图像改为96×96像素大小。第三步是将所有图像整理放入文件夹中,六个文件夹分别对应平扫期、皮髓质期、实质期、排泄期、后三期合并和四期合并。每个文件夹下设两个训练用子文件夹包含小肾肿瘤的两种不同类别。这两个文件分别命名为:0(所有fp-AML的图像),1(所有RCC的图像)。论文中构建的卷积神经网络包括十一层,其中四个卷积层,每一个卷积层后面紧跟一个最大池化层即四个最大池化层,最后面三层为一个扁平层和两个全连接层。模型建立过程包含两个阶段:训练阶段,采用十折交叉验证的方法,采用有监督的基于卷积神经网络模型的深度学习方法,类别作为学习数据;测试阶段,采用未用于训练的剩余数据作为测试集,用以评价模型性能。应用平扫期、皮髓质期、实质期和排泄期图像单独四期期相的图像,三期增强期相的图像以及四期所有期相的图像构建出六组模型。卷积神经网络模型分别预测该图像为两种类别的概率,二者概率和为1,最终概率大者作为模型的输出结果。应用受试者工作特征(receiver operating characteristic,ROC)曲线分析来评估卷积神经网络模型对于鉴别乏脂肪肾血管平滑肌脂肪瘤与肾癌的诊断效能。计算受试者工作特征曲线下面积(area under curve,AUC)。六组不同模型的平均AUC值间的比较应用DeLong检验(DeLong’s test)得到。P值小于0.05认为差异有统计学意义。研究结果:model unenhanced鉴别乏脂肪肾血管平滑肌脂肪瘤与肾癌的平均AUC值为0.64,95%可信区间为(95%confidence interval,CI):0.58-0.69;model corticomedullary为0.83,95%可信区间:0.81-0.85;model nephrographic为0.83,95%可信区间:0.81-0.85;model excretory为0.81,95%可信区间:0.79-0.83;model enhanced为0.85,95%可信区间:0.84-0.86;model quadruple为0.84,95%可信区间:0.83-0.85。结论:除model unenhanced外,其余五组卷积神经网络模型能够稳健的鉴别出乏脂肪肾血管平滑肌脂肪瘤与肾癌,接下来的研究可以应用这个方法去鉴别其它良性肿瘤与肾癌。第二部分基于MSCT的深度卷积神经网络预测肾透明细胞癌Fuhrman分级研究目的:使用基于卷积神经网络的深度学习方法,通过四期动态增强CT图像,构建预测T1a期肾透明细胞癌病理分级的卷积神经网络模型,并评价诊断模型的性能。研究方法:这一回顾性单中心研究由医院伦理委员会批准。所有肾透明细胞癌患者均在我院病理科电子档案库中查询得到,时间为2013年1月至2017年7月。共97位患者纳入研究,由72位男性患者与25位女性患者组成,其中69例低级别肾透明细胞癌;28例高级别肾透明细胞癌。这97位患者平均年龄55.64岁,年龄范围28-83岁。所有患者均使用设备320排容积CT进行肾脏四期规范化扫描,流程包括:平扫期、皮髓质期、实质期和排泄期。预处理的第一步分割与第二步方法同第一部分一致。97位患者的4936张分割图像(平扫期390张,皮髓质期1499张,实质期1547张,排泄期1500张)用于实验研究。第三步是将所有图像整理放入文件夹中,六个文件夹分别对应平扫期、皮髓质期、实质期、排泄期、后三期合并和四期合并。每个文件夹下设两个训练用子文件夹包含肾透明细胞癌的两种不同类别。这两个文件分别命名为:0(所有低级别ccRCC的图像),1(所有高级别ccRCC的图像)。论文中构建的卷积神经网络包括十二层,其中四个卷积层,每一个卷积层后面紧跟一个最大池化层即四个最大池化层,最后面四层为一个扁平层和三个全连接层,模型建立过程同第一部分一致。卷积神经网络模型分别预测该图像为两种类别的概率,二者概率和为1,最终概率大者作为模型的输出结果。应用ROC曲线分析来评估卷积神经网络模型对于鉴别T1a期肾透明细胞癌病理分级的诊断效能。计算AUC值。六组不同模型的平均AUC值间的比较应用DeLong检验(DeLong’s test)得到。P值小于0.05认为差异有统计学意义。研究结果:模型unenhanced鉴别肾透明细胞癌病理分级的平均AUC值为0.55,95%可信区间为:0.49-0.61;模型corticomedullary为0.77,95%可信区间:0.74-0.79;模型nephrographic为0.76,95%可信区间:0.74-0.79;模型excretory为0.69,95%可信区间:0.66-0.72;模型enhanced为0.78,95%可信区间:0.76-0.79;模型quadruple为0.75,95%可信区间:0.74-0.77。结论:我们的结果表明除模型unenhanced外,其余五组卷积神经网络模型或许能够用于区分高低级别的T1a期肾透明细胞癌。这一结果需要在更大规模数据集上的得到验证后才能用于临床。