论文部分内容阅读
第一部分CT影像组学模型在小细胞肺癌和非小细胞肺癌鉴别诊断中的价值研究
研究目的:
建立基于增强CT图像的不同病理类型肺癌的影像组学预测模型,探讨其在鉴别小细胞肺癌和非小细胞肺癌及不同亚型(腺癌、鳞癌、大细胞肺癌)中的临床应用价值。
研究对象与方法:
回顾性纳入2014年1月~2018年6月经病理证实的202例肺小细胞肺癌和266例非小细胞肺癌(包括鳞癌100例,腺癌100例,大细胞肺癌66例)患者。收集患者临床相关资料包括年龄、性别、吸烟史、肿瘤最大径、临床分期和血清肿瘤标志物,其中肿瘤标志物指标包括:血清胃泌素释放肽前体(pro-gastrin releasing peptide, ProGRP)、鳞状细胞癌相关抗原(squamous cell carcinoma antigen,SCCA)、癌胚抗原(carcinoembryonic antigen,CEA)、神经特异性烯醇化酶(neuron-specific enolase,NSE)和细胞角蛋白19片段(recombinant cytokeratin fragment antigen 21-1,cYFRA21-1)。所有患者均行双期增强CT扫描(动脉期和静脉期),所有病灶均经穿刺或手术标本取得病理结果。按7:3随机分成训练组(n=327)和验证组(n=141)。在ITK-SNAP软件中分别于动脉期和静脉期CT图像上手动勾画出病灶的兴趣区,采用A.K软件自动提取上述感兴趣区的影像组学特征,共计396个特征参数。使用LASSO套索回归模型进行数据的降维及特征选择。采用Logistic回归分析建立鉴别不同肺癌病理类型的多变量预测模型。在训练组中对临床因素进行相关性统计分析及多元逻辑回归分析,寻找有显著预测意义的临床指标,并与影像组学分数结合,基于多元逻辑回归分析建立列线图,绘制ROC曲线(receiver operating characteristic curve),计算曲线下面积(area under the curve,AUC)、灵敏度、特异度及准确度。从校准度和临床有用性方面对列线图的诊断性能进行评估。
结果:
在小细胞肺癌与非小细胞肺癌两组患者间,吸烟状态、血清胃泌素释放肽前体(pro-gastrin releasing peptide,ProGRP)、神经特异性烯醇化酶(neuron-specific enolase, NSE)和细胞角蛋白19片段(recombinant cytokeratin fragment antigen 21-1,cYFRA21-1)均存在显著的统计学差异(p<0.05)。从动脉期和静脉期CT图像中各自提取出396个影像组学参数,经降维后筛选出其中关键影像组学特征14个。
建立的影像组学标签在鉴别小细胞肺癌与非小细胞肺癌中诊断效能如下:AUC分别为训练组:0.86(95%CI:0.824~0.898)(可信区间,confidenceinterval,CI)和验证组:0.82(95%CI:0.752~0.891)。该预测模型在训练组中鉴别诊断的整体准确度、灵敏度和特异度分别为74.6%、64.8%和87.2%,其阳性预测值和阴性预测值分别为0.868和0.658。在验证组中,该预测模型的整体准确度、灵敏度和特异度分别为76.1%、66.7%和88.3%,其阳性预测值和阴性预测值分别为0.881和0.671。与临床参数预测模型(验证组AUC=0.86,95%CI:0.803~0.930)及影像组学标签(验证组AUC=0.82,95%CI:0.752~0.891)对比,影像组学标签结合临床相关因素的列线图在验证组中的AUC达0.94(95%CI:0.895~0.981),准确度、灵敏度、特异度分别达86.2%、84.7%、87.3%。列线图模型具有良好的区分度和校准性。
所建立的影像组学标签鉴别小细胞肺癌与非小细胞肺癌亚型腺癌诊断效能:AUC值分别为训练组:0.96(95%CI:0.941~0.992)和验证组:0.93(95%CI:0.877~0.991)。该预测模型在训练组中鉴别诊断的整体准确度、灵敏度和特异度分别为91.0%、90.0%和91.4%,其阳性预测值和阴性预测值分别为0.840和0.948。在验证组中,该预测模型的整体准确度、灵敏度和特异度分别为88.6%、94.4%和89.7%,其阳性预测值和阴性预测值分别为0.788和0.945。
所建立的影像组学标签鉴别小细胞肺癌与非小细胞肺癌亚型鳞状细胞癌的诊断效能:AUC值分别为训练组:0.95(95%CI:0.922~0.977)和验证组:0.91(95%CI:0.854~0.981)。该预测模型在训练组中鉴别诊断的整体准确度、灵敏度和特异度分别为90.0%、89.9%和90.2%,其阳性预测值和阴性预测值分别为0.816和0.937。在验证组中,该预测模型的整体准确度、灵敏度和特异度分别为86.4%、79.3%和89.8%,其阳性预测值和阴性预测值分别为0.793和0.898。
所建立的影像组学标签鉴别小细胞肺癌与非小细胞肺癌亚型大细胞肺癌的诊断效能:AUC值分别为训练组:0.86(95%CI:0.824~0.897)和验证组:0.79(95%CI:0.753~0.816)。该预测模型在训练组中鉴别诊断的整体准确度、灵敏度和特异度分别为75.3%、86.8%和65.1%,其阳性预测值和阴性预测值分别为0.711和0.818。在验证组中,该预测模型的整体准确度、灵敏度和特异度分别为71.6%、84.4%和67.6%,其阳性预测值和阴性预测值分别为0.675和0.779。
结论:
影像组学标签对于鉴别小细胞肺癌与非小细胞肺癌及其亚型具有较好的诊断效能,联合临床参数和影像组学特征的列线图对鉴别小细胞肺癌和非小细胞肺癌具有更好的诊断效能。
第二部分CT影像组学模型在预测肺癌Ki指数中的初步研究
研究目的:
建立基于增强CT图像的预测肺癌Ki指数的影像组学标签,并联合临床参数建立影像组学列线图预测肺癌的Ki-67表达水平。
研究对象与方法:
回顾性收集2014年1月至2018年12月接受胸部CT增强扫描并在检查后2周内经病理证实、行Ki-67表达水平检测的282例肺癌患者,其中腺癌158例,鳞癌69例,神经内分泌癌55例(包括小细胞肺癌38例,大细胞肺癌13例,类癌4例)。收集患者临床相关资料包括年龄、性别、吸烟史、肿瘤最大径和血清肿瘤标志物,其中血清肿瘤标志物指标包括:ProGRP、SCCA、CEA、NSE和cYFRA21-1。所有患者均行双期增强CT扫描(动脉期和静脉期),所有病灶均经穿刺或手术标本取得病理结果。按7:3随机分成训练组(n=197)和验证组(n=85)。定义Ki-67指数≤40%为低表达;>40%为高表达。利用ITK-SNAP软件中分别手动勾画出病灶CT增强图像的兴趣区,采用A.K软件提取感兴趣区的影像组学特征参数,共计396个特征参数。使用LASSO套索回归模型进行数据的降维及特征选择。采用Logistic回归分析建立区分Ki低表达与高表达肺癌的影像组学标签,在训练组中对临床因素进行相关性统计分析及多元逻辑回归分析,寻找有显著预测意义的临床指标,并与影像组学分数结合,基于多元逻辑回归分析建立列线图。应用AUC、准确度、灵敏度、特异度等指标对不同模型的预测效能进行评估。
结果:
107名肺癌患者被证实为Ki-67高表达,175名患者则被证实为Ki-67低表达。Ki-67高表达与低表达肺癌患者在年龄、性别和病理类型上存在显著性差异(P<0.05)。在训练组和验证组中,16个影像组学特征在Ki低表达和高表达肺癌间有显著性差异。
在影像组学标签中,训练组和验证组的AUC分别为0.88(95%CI:0.823~0.931)、0.86(95%CI:0.776~0.938),在训练组中其灵敏度、特异度和准确度分别为79.2%、84.3%和81.2%,在验证组中其灵敏度、特异度和准确度分别为74.6%、88.1%和79.8%。
联合影像组学特征和临床相关因素建立列线图,包括吸烟和神经特异性烯醇化酶(NSE)。列线图模型在训练组中AUC达0.90(95%CI:0.823~0.971),灵敏度、特异度和准确度分别为79.0%、85.4%和83.0%。验证组的AUC达0.87(95%CI:0.803~0.947),灵敏度、特异度和准确度分别为75.0%、90.2%和83.5%。与临床参数预测模型比较,影像组学标签结合临床相关因素的列线图模型在验证组中的预测效能(AUC=0.87,95%CI:0.803~0.947),准确度达83.5%,较临床参数预测模型(验证组AUC=0.72,95%CI:0.621~0.828;准确度:0.66)有明显提高。列线图模型具有良好的区分度和校准性。决策曲线分析显示,此列线图在临床上具有良好应用价值。
结论:
基于增强CT图像建立的影像组学标签有助于预测肺癌Ki-67的表达水平,联合影像组学特征和临床相关因素建立的列线图提高了模型的预测效能,为评估肺癌侵袭性和预后情况提供了一种无创性技术手段。
组AUC=0.72,95%CI:0.621~0.828;准确度:0.66)有明显提高。列线图模型具有良好的区分度和校准性。决策曲线分析显示,此列线图在临床上具有良好应用价值。
结论:
基于增强CT图像建立的影像组学标签有助于预测肺癌Ki-67的表达水平,联合影像组学特征和临床相关因素建立的列线图提高了模型的预测效能,为评估肺癌侵袭性和预后情况提供了一种无创性技术手段。
研究目的:
建立基于增强CT图像的不同病理类型肺癌的影像组学预测模型,探讨其在鉴别小细胞肺癌和非小细胞肺癌及不同亚型(腺癌、鳞癌、大细胞肺癌)中的临床应用价值。
研究对象与方法:
回顾性纳入2014年1月~2018年6月经病理证实的202例肺小细胞肺癌和266例非小细胞肺癌(包括鳞癌100例,腺癌100例,大细胞肺癌66例)患者。收集患者临床相关资料包括年龄、性别、吸烟史、肿瘤最大径、临床分期和血清肿瘤标志物,其中肿瘤标志物指标包括:血清胃泌素释放肽前体(pro-gastrin releasing peptide, ProGRP)、鳞状细胞癌相关抗原(squamous cell carcinoma antigen,SCCA)、癌胚抗原(carcinoembryonic antigen,CEA)、神经特异性烯醇化酶(neuron-specific enolase,NSE)和细胞角蛋白19片段(recombinant cytokeratin fragment antigen 21-1,cYFRA21-1)。所有患者均行双期增强CT扫描(动脉期和静脉期),所有病灶均经穿刺或手术标本取得病理结果。按7:3随机分成训练组(n=327)和验证组(n=141)。在ITK-SNAP软件中分别于动脉期和静脉期CT图像上手动勾画出病灶的兴趣区,采用A.K软件自动提取上述感兴趣区的影像组学特征,共计396个特征参数。使用LASSO套索回归模型进行数据的降维及特征选择。采用Logistic回归分析建立鉴别不同肺癌病理类型的多变量预测模型。在训练组中对临床因素进行相关性统计分析及多元逻辑回归分析,寻找有显著预测意义的临床指标,并与影像组学分数结合,基于多元逻辑回归分析建立列线图,绘制ROC曲线(receiver operating characteristic curve),计算曲线下面积(area under the curve,AUC)、灵敏度、特异度及准确度。从校准度和临床有用性方面对列线图的诊断性能进行评估。
结果:
在小细胞肺癌与非小细胞肺癌两组患者间,吸烟状态、血清胃泌素释放肽前体(pro-gastrin releasing peptide,ProGRP)、神经特异性烯醇化酶(neuron-specific enolase, NSE)和细胞角蛋白19片段(recombinant cytokeratin fragment antigen 21-1,cYFRA21-1)均存在显著的统计学差异(p<0.05)。从动脉期和静脉期CT图像中各自提取出396个影像组学参数,经降维后筛选出其中关键影像组学特征14个。
建立的影像组学标签在鉴别小细胞肺癌与非小细胞肺癌中诊断效能如下:AUC分别为训练组:0.86(95%CI:0.824~0.898)(可信区间,confidenceinterval,CI)和验证组:0.82(95%CI:0.752~0.891)。该预测模型在训练组中鉴别诊断的整体准确度、灵敏度和特异度分别为74.6%、64.8%和87.2%,其阳性预测值和阴性预测值分别为0.868和0.658。在验证组中,该预测模型的整体准确度、灵敏度和特异度分别为76.1%、66.7%和88.3%,其阳性预测值和阴性预测值分别为0.881和0.671。与临床参数预测模型(验证组AUC=0.86,95%CI:0.803~0.930)及影像组学标签(验证组AUC=0.82,95%CI:0.752~0.891)对比,影像组学标签结合临床相关因素的列线图在验证组中的AUC达0.94(95%CI:0.895~0.981),准确度、灵敏度、特异度分别达86.2%、84.7%、87.3%。列线图模型具有良好的区分度和校准性。
所建立的影像组学标签鉴别小细胞肺癌与非小细胞肺癌亚型腺癌诊断效能:AUC值分别为训练组:0.96(95%CI:0.941~0.992)和验证组:0.93(95%CI:0.877~0.991)。该预测模型在训练组中鉴别诊断的整体准确度、灵敏度和特异度分别为91.0%、90.0%和91.4%,其阳性预测值和阴性预测值分别为0.840和0.948。在验证组中,该预测模型的整体准确度、灵敏度和特异度分别为88.6%、94.4%和89.7%,其阳性预测值和阴性预测值分别为0.788和0.945。
所建立的影像组学标签鉴别小细胞肺癌与非小细胞肺癌亚型鳞状细胞癌的诊断效能:AUC值分别为训练组:0.95(95%CI:0.922~0.977)和验证组:0.91(95%CI:0.854~0.981)。该预测模型在训练组中鉴别诊断的整体准确度、灵敏度和特异度分别为90.0%、89.9%和90.2%,其阳性预测值和阴性预测值分别为0.816和0.937。在验证组中,该预测模型的整体准确度、灵敏度和特异度分别为86.4%、79.3%和89.8%,其阳性预测值和阴性预测值分别为0.793和0.898。
所建立的影像组学标签鉴别小细胞肺癌与非小细胞肺癌亚型大细胞肺癌的诊断效能:AUC值分别为训练组:0.86(95%CI:0.824~0.897)和验证组:0.79(95%CI:0.753~0.816)。该预测模型在训练组中鉴别诊断的整体准确度、灵敏度和特异度分别为75.3%、86.8%和65.1%,其阳性预测值和阴性预测值分别为0.711和0.818。在验证组中,该预测模型的整体准确度、灵敏度和特异度分别为71.6%、84.4%和67.6%,其阳性预测值和阴性预测值分别为0.675和0.779。
结论:
影像组学标签对于鉴别小细胞肺癌与非小细胞肺癌及其亚型具有较好的诊断效能,联合临床参数和影像组学特征的列线图对鉴别小细胞肺癌和非小细胞肺癌具有更好的诊断效能。
第二部分CT影像组学模型在预测肺癌Ki指数中的初步研究
研究目的:
建立基于增强CT图像的预测肺癌Ki指数的影像组学标签,并联合临床参数建立影像组学列线图预测肺癌的Ki-67表达水平。
研究对象与方法:
回顾性收集2014年1月至2018年12月接受胸部CT增强扫描并在检查后2周内经病理证实、行Ki-67表达水平检测的282例肺癌患者,其中腺癌158例,鳞癌69例,神经内分泌癌55例(包括小细胞肺癌38例,大细胞肺癌13例,类癌4例)。收集患者临床相关资料包括年龄、性别、吸烟史、肿瘤最大径和血清肿瘤标志物,其中血清肿瘤标志物指标包括:ProGRP、SCCA、CEA、NSE和cYFRA21-1。所有患者均行双期增强CT扫描(动脉期和静脉期),所有病灶均经穿刺或手术标本取得病理结果。按7:3随机分成训练组(n=197)和验证组(n=85)。定义Ki-67指数≤40%为低表达;>40%为高表达。利用ITK-SNAP软件中分别手动勾画出病灶CT增强图像的兴趣区,采用A.K软件提取感兴趣区的影像组学特征参数,共计396个特征参数。使用LASSO套索回归模型进行数据的降维及特征选择。采用Logistic回归分析建立区分Ki低表达与高表达肺癌的影像组学标签,在训练组中对临床因素进行相关性统计分析及多元逻辑回归分析,寻找有显著预测意义的临床指标,并与影像组学分数结合,基于多元逻辑回归分析建立列线图。应用AUC、准确度、灵敏度、特异度等指标对不同模型的预测效能进行评估。
结果:
107名肺癌患者被证实为Ki-67高表达,175名患者则被证实为Ki-67低表达。Ki-67高表达与低表达肺癌患者在年龄、性别和病理类型上存在显著性差异(P<0.05)。在训练组和验证组中,16个影像组学特征在Ki低表达和高表达肺癌间有显著性差异。
在影像组学标签中,训练组和验证组的AUC分别为0.88(95%CI:0.823~0.931)、0.86(95%CI:0.776~0.938),在训练组中其灵敏度、特异度和准确度分别为79.2%、84.3%和81.2%,在验证组中其灵敏度、特异度和准确度分别为74.6%、88.1%和79.8%。
联合影像组学特征和临床相关因素建立列线图,包括吸烟和神经特异性烯醇化酶(NSE)。列线图模型在训练组中AUC达0.90(95%CI:0.823~0.971),灵敏度、特异度和准确度分别为79.0%、85.4%和83.0%。验证组的AUC达0.87(95%CI:0.803~0.947),灵敏度、特异度和准确度分别为75.0%、90.2%和83.5%。与临床参数预测模型比较,影像组学标签结合临床相关因素的列线图模型在验证组中的预测效能(AUC=0.87,95%CI:0.803~0.947),准确度达83.5%,较临床参数预测模型(验证组AUC=0.72,95%CI:0.621~0.828;准确度:0.66)有明显提高。列线图模型具有良好的区分度和校准性。决策曲线分析显示,此列线图在临床上具有良好应用价值。
结论:
基于增强CT图像建立的影像组学标签有助于预测肺癌Ki-67的表达水平,联合影像组学特征和临床相关因素建立的列线图提高了模型的预测效能,为评估肺癌侵袭性和预后情况提供了一种无创性技术手段。
组AUC=0.72,95%CI:0.621~0.828;准确度:0.66)有明显提高。列线图模型具有良好的区分度和校准性。决策曲线分析显示,此列线图在临床上具有良好应用价值。
结论:
基于增强CT图像建立的影像组学标签有助于预测肺癌Ki-67的表达水平,联合影像组学特征和临床相关因素建立的列线图提高了模型的预测效能,为评估肺癌侵袭性和预后情况提供了一种无创性技术手段。