论文部分内容阅读
目的:通过对比显微镜下视觉评估(Visual Assessment,VA)、参考Ki-67标准比对卡(Ki-67 Standard Reference Card,SRC)、显微镜下人工计数(Manual Counting,MC)及人工智能计数(Artificial Intelligence Counts,AI)判读乳腺癌Ki-67指数(Ki-67 Label Index,Ki-67LI)的差异性与可重复性,建立人工智能辅助判读的训练集与验证集,探讨人工智能辅助判读乳腺癌Ki-67LI的临床适用性。方法:收集河北医科大学第四医院2017年10月-2019年10月行乳腺癌改良根治术后标本300例,150例用于建立训练集,另外150例用于验证集。PRECICE 600全自动数字切片扫描仪扫描Ki-67免疫组织化学染色切片。使用腾讯人工智能平台制作5%-90%不等的Ki-67标准比对卡。训练集由不同年资9位病理医师以两周时间为间隔,相同场景下,分别通过VA、SRC、MC、AI,独立进行乳腺癌Ki-67LI判读。验证集由分层随机选择的3名病理医师分别通过SRC和AI进行Ki-67LI判读。结果采用SPSS 23.0统计软件分析。Kolmogorov-Smirnov(K-S)用于正态性检验,Friedman M及Bonferroni校正用于差异性分析,一致性选用组内相关系数(Intraclass correlation coefficient,ICC)和Bland-Altman散点图。结果:1训练集1)四种方法判读的Ki-67LI均不服从正态分布(P<0.05)。Friedman M检验显示,相同方法中病理医师间差异具有统计学意义(P<0.05)。Bonferroni校正后,SRC与AI判读的Ki-67LI只表现出各病理医师与金标准间差异具有统计学意义(P<0.05),病理医师之间差异无统计学意义(P>0.05)。2)经人工智能辅助判读的Ki-67LI观察者间一致性明显优于无人工智能辅助的判读方式。9名病理医师通过SRC判读Ki-67LI的ICC值为0.918(0.899,0.936),AI法的ICC值为0.972(0.964,0.978)。而未经人工智能辅助的VA法的ICC值为0.757(0.711,0.802),MC法的ICC值为0.803(0.763,0.841)。通过SRC和AI,9名病理医师与金标准的一致性均非常好,ICC值均在0.80以上。3)9名病理医师按工作年限分成三组,高、中和低年资医师各3名。比较参考SRC前后ICC值,发现3名初级病理医师通过SRC后,ICC值均增加到0.80以上。4)同质组中,VA、MC、SRC、AI的观察者间一致性均非常好,I CC值均在0.80以上。异质组中,只有SRC和AI判读Ki-67LI表现出了病理医师间较好的一致性。(ICC分别为0.877(0.844,0.907)和0.959(0.947,0.970))。而通过VA和MC,病理医师间一致性较差(ICC分别为0.698(0.634,0.760)和0.672(0.605,0.738))。2验证集通过SRC,3位病理医师的ICC值为0.988(0.985,0.911)。采用AI,ICC值为0.990(0.987,0.992)。3名病理医师与金标准一致性均非常好,ICC值均在0.95以上。同质组、异质组中,SRC、AI的病理医师间一致性均非常好,ICC值分别为0.985(0.978,0.990)、0.986(0.979,0.990)0.990(95%置信区间0.986,0.993)、0.991(0.986,0.994)。结论:1.AI显著提高了病理医师间的可重复性,且真实值更接近金标准,由此可见,AI判读是提高乳腺癌Ki-67LI重现性的良好方法。2.Ki-67标准比对卡有助于增加病理医师判读乳腺癌Ki-67LI的一致性,尤其是初、中级病理医师,在AI软件尚未普及的情况下,Ki-67标准比对卡可作为辅助判读乳腺癌Ki-67LI的简便工具。