基于深度学习的端到端自动乳腺X线密度分类模型的构建及临床应用研究

来源 :南方医科大学 | 被引量 : 0次 | 上传用户:gliu0307
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
乳腺癌目前已跃居女性恶性肿瘤的首位,且发病年龄呈年轻化的趋势,因此乳腺癌的早期发现、早期诊断及治疗至关重要。乳腺X线摄影检查是乳腺癌筛查最主要的检查手段,乳腺X线密度是用于描述乳腺X线摄影中女性乳腺纤维腺体组织比例的量度,可以定性或定量测量乳腺密度。致密型乳腺为乳腺癌的独立危险因素之一,致密型乳腺的女性患乳腺癌的可能性要比脂肪型乳腺高4-6倍,同时也是乳腺X线摄影早期筛查乳腺癌敏感性及特异性偏倚的主要因素之一。2009年美国康涅狄格州通过的致密乳腺告知法案要求致密型乳腺女性需了解致密乳腺存在的风险因素及辅助筛查手段对致密乳腺的局限,患者可自愿选择是否进行补充筛查。目前美国已有31个州通过了该项立法。因为补充筛查和风险管理的建议可能因乳腺X线密度而异,所以在临床中极其需要对乳腺密度进行准确且一致的评估。乳腺密度有多种分类方法,目前使用最普遍的是由美国放射学会定义的BI-RADS 分类。该方法是主观的,具有一定的观察者内及观察者间差异。然而,最新版(第5版)BI-RADS分类的修改调整更进一步增加了临床评估的可变性。本文收集一定样本量的筛查女性的乳腺X线图像,参照国际最新规范BI-RADS第5版分类标准及临床实践,回顾性分析观察者间乳腺X线密度分类的一致性及原始报告的可靠性,分析临床乳腺X线密度分类评估的准确性及可重复性,为后续初步评价基于深度学习的自动乳腺X线密度分类模型的分类性能提供参考依据。近年来,利用计算机辅助进行医学图像的分类技术已经被广泛应用。随着深度学习技术的兴起和发展,基于深度学习的医学图像处理技术的研究也成为了计算机辅助医学影像领域的热门问题。在乳腺影像领域,目前已有不少利用深度学习技术检测及分类乳腺良恶性肿块和钙化的研究,但在乳腺密度分类方面却鲜有研究。本研究尝试将深度学习应用于乳腺X线密度分类当中,利用深度学习的模式自动获取基于BI-RADS第5版的乳腺密度类别,并初步评价深度学习模型对乳腺密度的分类性能,以期提供一个有前途的计算机化工具包,以辅助影像医师准确判读出致密型乳腺,指导进一步的临床筛查工作。论文正文分为以下4个部分:前言,主要阐述研究背景、意义,概述致密型乳腺筛查方法的现状及局限,总结乳腺X线密度评估方法的现状及特点,并引入深度学习与卷积神经网络这一概念,阐述其在相关领域的研究及成果。基于乳腺密度标准化的需求,结合深度卷积网络的特点,提出构建自动乳腺X线密度分类模型这一设想。目的在于初步评价自动乳腺密度分类模型的研究背景及应用前景,为后续研究提供理论依据。第一部分为基于第五版BI-RADS评价乳腺密度的一致性研究。收集2016年1月~5月于我院行乳腺X线筛查的774例女性的图像,参照第五版BI-RADS分类标准,由3名不同年资医师单独评估乳腺X线密度分类,并以3名医师共同阅片达成的一致分类为相对金标准,采用χ2检验分析不同年龄组筛查女性乳腺X线密度差异。采用Cohen’skappa检验来评估分类的一致性,采用准确率评估分类的可靠性。774例图像中,a脂肪类乳腺13例,b散在纤维腺体类乳腺112例,c不均匀致密类乳腺526例,d极度致密类乳腺123例。<60岁与≥60岁筛查妇女间乳腺X线密度差异有统计学意义;低(R1)、中(R2)、高(R3)年资医师及原始报告分类准确率分别为81.14%(628/774)、87.86%(680/774)、90.96%(704/774)、67.70%(524/774);R1与相对金标准的一致性中等(Kappa=0.602),R2、R3与相对金标准的一致性较好(Kappa=0.766、0.817),原始报告与相对金标准的一致性中等(Kappa=0.430);R1、2、3分类的观察者间的总体一致性中等(Kappa=0.671),两两一致性从较差到中等(Kappa=0.396~0.604),以上P均<0.001。本部分结果表明:1、乳腺癌筛查妇女年龄与乳腺X线密度有关,随着年龄增长,乳腺X线密度呈减低趋势。2、不同观察者对最新的第5版BI-RADS分类的掌握和熟练程度不同,对乳腺X线密度遮蔽程度的感知不同。3、临床实践中对乳腺分类评估的可靠性有限,可通过专门训练增进诊断医师经验或开发基于第5版BI-RADS的自动乳腺密度分类工具,以更准确地判读乳腺密度类型。第二部分为基于深度学习的端到端自动乳腺X线密度分类模型的构建研究。收集2015年于我院行乳腺X线筛查摄影的女性,共960例,每例选取单侧CC位图像,由3名乳腺影像诊断医师重新阅片,以3人意见一致的分类作为每张图像的标签,经过图像预处理及数据集(训练集、验证集及测试集)划分,将预处理后的图像输入以Inception-ResNet-v2为基本网络构建的模型,使用ReLU作为激活函数,使用categorical-crossentrpy作为损失函数,使用Adam作为优化函数,并从头开始训练,最后利用测试集测试训练好的模型对未知分类数据集的预测能力,评估模型的分类性能。采用查准率、查全率与综合分类率作为评价模型对单个类别的分类效果的指标,采用宏平均及微平均作为评价模型整体分类效果的指标。200例测试集中,a、b、c、d各分类的比例为1:1:1:1,模型预测的结果a、b、c、d各分类的查准率分别为0.75,0.91,0.79,0.98;a、b、c、d各分类的查全率分别为0.96,0.58,0.98,0.82;a、b、c、d各分类的综合分类率分别为0.84,0.71,0.88,0.89。模型的宏平均查准率、查全率与综合分类率分别为0.86,0.84,0.83;模型的微平均值为0.84。本部分结果表明:1、基于深度学习的自动乳腺密度分类方法能够从相对少量的训练图像中有效地识别基本成像特征,以区分四个BI-RADS乳腺密度类别。2、模型整体分类性能较好,模型各分类中的查准率及查全率最高可达0.98。3、模型对c、d类的分类效果较好,但对a、b类的区分度欠佳。原因主要是①基于中国女性乳腺密度分布的特点,脂肪类乳腺比例相对较少,纳入的脂肪型病例不够典型;②样本数据集的限制,暂不足以使模型完全提取a类与b类不同的成像特征并将其有效区分。第三部分为端到端自动分类模型与临床评估对比分析,收集2015年于我院行乳腺X线筛查摄影的女性,共200例(数据同第三部分测试集),每例选取单侧CC位图像,由3名乳腺影像诊断医师重新阅片,以3人意见一致的分类作为每张图像的标准分类。采用Cohen’skappa检验来评估模型与临床分类的一致性。采用准确率来评估模型分类的可靠性。200例相同比例类别的图像中,基于四分类评估a、b、c、d各分类中模型与临床评估完全一致的分别有48、29、49、41;基于二分类评估非致密型、致密型各分类中,模型与临床评估完全一致的分别有94、98。与临床的标准分类相比,模型四分类的准确率为0.84,二分类的准确率为0.96,四分类kappa值为0.78,二分类kappa值为0.92。第一部分结果中,不同年资医师四分类的平均准确率为0.87,四分类kappa值为0.73;原始报告四分类的准确率为0.68,四分类kappa值为0.43。模型与临床对乳腺X线密度BI-RADS分类的评估不一致率主要集中分布在a/b评估上,而b/c、c/d及跨两个类别的不一致率均较低,分别为0.03、0.04及0.01。本部分结果表明:1、模型分类的准确率及一致性均较高,模型分类与临床医生的平均分类水平基本一致,表明模型能够在减少观察者间可变性的基础上模拟放射科医师临床实践中的乳腺密度评估行为。2、模型在乳腺密度二分类法的表现突出,有望成为乳房密度分层筛查的合适选择,适用于临床和研究领域的乳腺X线密度BI-RADS分类评估。全文结论:1、本课题总结了基于BI-RADS第5版的观察者间乳腺X线密度分类的一致性及原始报告的可靠性,分析临床乳腺X线密度分类评估的准确性及可重复性,为后续初步评价基于深度学习的自动乳腺X线密度分类模型的分类性能提供参考依据。2、本课题构建了基于深度学习的端到端自动乳腺X线密度分类模型,并初步证实了模型基于BI-RADS分类评估乳腺X线密度的可行性。3、本课题进行模型与临床乳腺密度评估的对比分析,并初步证实了模型基于BI-RADS 评估乳腺X线密度分类的临床实用性。
其他文献
微全分析系统,又被称为芯片实验室(Lab on a Chip),是把化学、医学、生物学等领域中涉及到的样品分析过程集成到同一块微米尺度的芯片上,从而完成样品制备、反应过程及分离富集等基本操作,使其实现自动分析的全过程。微流控芯片能够在较大程度上缩短处理样本的时间,并且精密控制液体的流动,从而节约试剂耗材。总之,微流控技术是一门在医学、生物学、化学、纳米技术、微电子和微机械基础上发展起来的全新的交叉
学位
背景与研究目的超极化激活环核苷酸门控阳离子通道(Hyperpolarization-activated cyclic nucleotide-gated channels,HCN)属于电压门控型离子通道超家族,具有独特的生物物理学特性。哺乳动物中该通道有四种亚型(HCN1-HCN4),广泛分布于心脏和神经系统,并介导重要的生理功能。其功能异常与系列心脏和神经兴奋性失调疾病的发生密切相关,如炎性痛或神
学位
研究目的:流感的季节性流行和大爆发,造成了很高的发病率和致死率,对于人类社会危害性极高。由于流感病毒变异速度快且难以预测,大大地降低了疫苗的有效预防效果。目前,FDA批准上市的抗流感病毒药物只有M2离子通道抑制剂和神经氨酸酶抑制剂两种,而且面临日益严重的耐药性问题,因此迫切需要研制新的药物。为了满足对新型抗流感病毒药物的需求,本论文从海洋贝类生物海瓜子中分离得到一个具有抗流感病毒活性化合物焦脱镁叶
学位
背景:非酒精性脂肪性肝炎(nonalcoholic steatohepatitis,NASH)是非酒精性脂肪性肝病(nonalcoholic fatty liver disease,NAFLD)的进展性疾病阶段。胆管反应(ductular reaction,DR)与NASH疾病进展和肝纤维化分期密切相关。Yes相关蛋白(yes-associatedprotein,YAP)激活在NASH相关的肝纤维
学位
类风湿性关节炎(Rheumatoid arthritis,RA)是一种慢性、以炎性滑膜炎为主的系统性疾病,可以导致关节畸形及功能丧失,其世界范围内的发病率约为0.5%-1.0%。研究表明有超过70%的RA患者出现胰岛素抵抗,其患糖尿病的几率为正常人的1.6倍。研究发现,在RA状态下,多种药物代谢酶及转运体的功能和表达发生显著变化,进而影响药物的有效性和毒性。二甲双胍作为糖尿病治疗的一线药物,其药代
学位
冠心病是威胁人类社会最主要的死亡危险因素之一。冠心病可导致患者左室重构,加快病情进展,严重影响患者的生存预后。冠心病的进展是一系列代谢物发生改变的复杂过程,测定单一的代谢标志物无法特异有效的预测临床终点事件的发生风险。目前,尚缺乏系统评估冠心病患者内源性代谢物影响临床预后的代谢组学研究。因此,本研究拟在中国冠心病随访队列人群中,基于广泛靶向代谢组学研究血浆代谢物对临床终点事件和左室重构的影响及预测
学位
艾滋病(AIDS)是由免疫缺陷病毒(HIV)引起的人类最严重的单一病因传染性疾病。它的传染性、致命性和危害性给社会带来了严重的威胁。虽然高效抗逆转录病毒疗法(HAART)的应用将艾滋病从一种致死性疾病转变成一种慢性可控性疾病,延长了患者的生存时间。但是该疗法只能控制HIV而无法彻底清除,一旦停止用药,HIV会迅速反弹,使得患者再次感染AIDS。研究表明不能彻底清除HIV的主要原因是由于HIV潜伏病
学位
研究背景和目的:肾间质纤维化是各种慢性肾脏病发展至终末期肾衰竭的共同通路,其特征是过量的细胞外基质在肾间质沉积和肾组织结构遭破坏,最终导致肾功能衰竭。车叶草苷酸(ASPA),是一种具有生物活性的环烯醚萜类单体,表现出良好的抗肿瘤、抗氧化和抗炎活性。然而,ASPA对单侧输尿管结扎(UUO)诱导肾间质纤维化的作用及其作用机制和在疾病状态下体内药动学的变化未见报道。本课题主要研究以下问题:(1)ASPA
学位
研究背景整合素受体αvβ3在肿瘤新生血管及部分肿瘤细胞中高表达。课题组前期利用RGD环肽可与整合素αvβ3受体特异性结合特点,以小分子化合物将两个RGD环肽与siRNA分子通过共价偶联得到biRGD-siRNA分子,用于肿瘤靶向治疗。biRGD-siRNA可通过RNA干扰原理靶向沉默目的基因的表达,在基因水平治疗疾病。前期结果提示biRGD-siRNA分子可增强细胞摄取、促进内体释放并靶向体内肿瘤
学位
背景Hedgehog(Hh)信号通路作为一种高度保守的信号通路,在哺乳动物胚胎发育、组织稳态的维持中发挥着关键作用9,7,24。该通路的异常活化可介导多种肿瘤的发生、发展。研究表明,Hh通路抑制剂可以用于恶性肿瘤的治疗7,以Hh为靶点的抑制剂有望成为治疗肿瘤的新型分子靶向药物。目前,以Hh信号通路组分 Smoothened(Smo)为靶标的药物 Vismodegib、Sonidegib 和 Gla
学位