论文部分内容阅读
目前乳腺癌已成为女性最常见恶性肿瘤,不论在发达国家还是发展中国家,其发病率都呈上升趋势。乳腺X线摄影是乳腺癌筛查和诊断的主要影像手段,对于微钙化尤其敏感。大量研究表明乳腺X线摄影对乳腺病变有着较高的诊断价值。本文收集一定样本量的乳腺X线摄影钙化病变病例,结合BI-RADS分类以及临床实践,总结乳腺X线摄影对钙化病变的诊断价值,并对乳腺癌筛查及诊断策略进行初步探讨。近些年,计算机辅助诊断的迅速发展为乳腺X线摄影诊断增添不少砝码,但目前的推广及应用程度远远不够,原因在于其仍然存在许多局限和不足。深度学习方法的出现能够拓展研究方向。它已经在语音、图像识别等领域取得巨大成功,但较少涉足医学图像处理及识别领域。本研究尝试将深度卷积神经网络运用到乳腺X线摄影图像处理当中,进行乳腺钙化图像的深度卷积特征提取,并结合当前性能较良好的SVM算法进行分类器训练,初步评价分类器对乳腺钙化病灶良恶性鉴别及BI-RADS分类效果。论文正文主要分为以下4个章节:第一章绪论主要介绍研究背景、意义,概述乳腺X线摄影在乳腺癌筛查和诊断领域的优势和局限,叙述计算机辅助诊断的现状,并引入深度学习这一概念,阐述其在相关领域的研究和成果,最后将深度学习(卷积神经网络)与乳腺X线摄影钙化病变图像联系起来,目的在于初步评价基于深度卷积特征的乳腺X线摄影钙化病变良恶性鉴别及BI-RADS分类效果。第二章深度学习概述主要内容为深度学习的基本概念以及常用的深度学习方法,为后续章节的研究提供理论基础。第三章乳腺钙化病变的X线摄影诊断及病理对照收集我院2009年1月~2015年10月期间,符合纳入标准的乳腺X线摄影钙化病变病例,结合BI-RADS分类以及临床实践,将BI-RADS Ⅳa类分别定义为阳性/阴性,以金标准病理结果作为对照进行验证,从准确率、敏感度、特异度等以及ROC曲线这几方面进行结果分析,总结乳腺X线摄影对钙化类型乳腺病变的良恶性及BI-RADS分类诊断价值,能够对乳腺癌筛查、诊断策略进行探讨,也为后续初步评价基于深度卷积特征的乳腺X线摄影钙化病变良恶性鉴别及BI-RADS分类效果提供参考依据。共计383例符合纳入标准的乳腺钙化病变,BI-RADS分类诊断结果分别为0类2例、Ⅰ类8例、Ⅲ类47例、Ⅳ类185例(Ⅳa类94例、Ⅳb类45例、Ⅳc类46例)以及V类141例,而诊断准确率依次分别为:0类50%、Ⅱ类100%、Ⅲ类93.62%、Ⅳb类68.89%、Ⅳc类84.78%、Ⅴ类99.29%以及Ⅳa类43.62%(定义为阳性)或56.38%(定义为阴性);乳腺X线摄影诊断与病理对照方面,其结果因Ⅳa类病变定义不同而有所差异。Ⅳa类为阳性病变时,乳腺X线摄影对钙化病变的诊断敏感度、特异度、阳性预测值及阴性预测值分别为98.82%、40.63%、76.83%以及94.55%,ROC曲线下面积为0.697±0.022;Ⅳa类为阴性病变时,乳腺X线摄影对钙化病变的诊断敏感度、特异度、阳性预测值及阴性预测值分别为82.75%、82.03%、90.17%以及70.47%,ROC曲线下面积为0.824±0.021。本部分结果表明:1、乳腺X线摄影对乳腺钙化病变有着较高的诊断效能,对应不同的BI-RADS分类,其准确率稍有差异。BI-RADSⅡ类(100%)、Ⅲ类(93.62%)以及V类(99.29%)病变的诊断准确率达到很高的水平,而Ⅳ类病变(60%)的总体诊断准确率稍低。2、乳腺X线摄影诊断BI-RADS分类结果与病理对照方面,在Ⅳa类病变定义不同情况下,其诊断敏感度、特异度、阳性预测值、阴性预测值及ROC曲线下面积均有所不同,Ⅳa类病变表示为阳性时,有着很高的敏感度,但特异度较低,表明误诊率稍高,预示着可能存在着过度诊断或非必要的活检出现的可能性;当Ⅳa类病变表示为阴性时,敏感度及特异度均较高,两者之间体现出较好的平衡性。3、本章节基于ⅣA类病变为阳性/阴性的不同情况,总结乳腺X线摄影诊断乳腺钙化病变(383例)的准确率、敏感度、特异度以及ROC曲线下面积,分析乳腺X线摄影对乳腺钙化病变的诊断效能,对乳腺癌筛查、诊断策略进行了初步探讨,可为后续基于深度卷积特征的乳腺X线摄影钙化良恶性鉴别及BI-RADS分类初步研究提供重要参考依据。第四章基于深度卷积特征的乳腺钙化良恶性鉴别及BI-RADS分类初步研究通过收集符合纳入标准的乳腺X线摄影钙化病变病例,其中CC位图像375幅,MLO位图像368幅,运用基于自然图像训练得到的深度卷积神经网络,尝试初步评价其对乳腺钙化病变良恶性鉴别及BI-RADS分类效果。本文中,基于深度卷积特征的提取及后续SVM分类训练过程均在MATLAB开发工具环境下进行,此过程需要比较统一、标准的输入及相应的输出结果,因而对纳入的乳腺钙化病变相关数据进行相应预处理,步骤包括:①图像储存;②资料归类;③Excel表信息汇总;④钙化病变区域圈注及格式处理;作用在于能够在最大程度包括钙化病变范围的同时,减少非乳腺区域以及乳腺组织本身的图像信息干扰。⑤修正BI-RADS分类。通过基于自然图像训练的深度卷积神经网络进行钙化病变卷积特征提取,并结合当前机器学习领域广泛应用的SVM算法,进行分类器训练,并进行10-fold交叉验证,最后得到平均结果。乳腺钙化病变图像预处理相关结果方面,所有383例病例均进行完整的资料汇总,包括检查号、病变部位、影像BI-RADS分类、修正BI-RADS分类、病理结果以及良恶性结果,无资料缺失;另外,所有383例乳腺钙化病例均成功进行钙化病变区域圈注,效果良好。良恶性识别分类器结果方面,基于CC位乳腺X线摄影钙化病变图像卷积特征的分类器TPR区间为0.545-0.778,平均为0.686;TNR区间为0.444.0.889,平均为0.690;等错误率(equal error rate, EER)区间为0.210.0.400,平均为0.289;总体诊断准确率约为68.8%,ROC曲线下面积分别约为0.766;相类似,基于MLO位乳腺X线摄影钙化病变图像卷积特征的分类器TPR区间为0.50.0.80,平均为0.672;TNR区间为0.50.0.876,平均为0.677;EER区间为0.177.0.50,平均为0.331;总体诊断准确率约为67.4%,ROC曲线下面积分别约为0.741。由于BI-RADS IV类病变(包括Ⅳa~Ⅳc类)之间存在较大的特征重叠区域,在寻找分类方向上存在困难。因此,我们认为以目前乳腺X线摄影钙化病变图像数据集样本量还不够得到分类效果较良好的BI-RADS分类识别模型。本部分结果表明:1、乳腺X线摄影钙化病变图像数据集的建立,为基于深度卷积神经网络的钙化良恶性鉴别等提供了数据基础;2、基于CC位、MLO位乳腺X线摄影钙化病变图像的良恶性鉴别具有一定的准确性,但总体结果不算高,仍有较大的提升空间;3、由于样本数据集不足,暂未能训练获得效果良好的BI-RADS分类识别模型。