论文部分内容阅读
研究背景和目的:原发性肝癌是全世界第四大癌症致死原因。绝大多数原发性肝癌的组织学类型是肝细胞癌(Hepatocellular carcinoma,HCC),约占总病例数的九成。超过90%的肝癌患者都具有慢性肝病的背景,各种原因引起的肝硬化是肝癌发生发展最重要的高危因素。中国临床肿瘤学会(Chinese Society of Clinical Oncology,CSCO)制定的肝癌诊疗指南推荐对大于35岁的男性肝癌高风险人群以及大于45岁的女性肝癌高风险人群进行每半年一次腹部超声联合或不联合甲胎蛋白(AFP)筛查,检测发现的结节应通过计算机断层扫描(Computed tomography,CT)/核磁共振成像(Magnetic resonance imaging,MRI)或者病理活检进一步确诊。液体活检是一种对多种生物学样本进行无创检测和动态分析的新兴技术,由于具有操作简便、可重复实验、能反应肿瘤原发或转移部位的生物学信息等优势,因此在实体肿瘤早期诊断、预后评估、疾病进展和疗效监测、揭示发病机理和寻找药物靶点等方面均有巨大应用前景。作为液体活检的重要检测指标——细胞游离DNA(cell-free DNA,cf DNA)已被证实能够反应肿瘤组织的信息,特别是cf DNA甲基化与5羟甲基化指标已在多种肿瘤中被证明可作为新型肿瘤诊断或监测分子标志物。本课题旨在通过系统分析肝癌患者cf DNA全基因组特征,筛选肝癌特异性新型血清学标志物组合,从而为肝癌早期诊断和预警筛查提供新方法和新策略。研究方法:1、从来自全国11个省份的16家医院入组肝癌、肝硬化、健康人群,总人数达5561,进行半年一次、为期三年的随访,同时从入组开始每次随访采集队列人群的外周血10m L,从中提取出cf DNA。2、利用5-羟甲基胞嘧啶(5-hydroxymethylcytosine,5hm C)测序、低通量全基因组测序(low-pass whole-genome sequencing,low-pass WGS)、环化单分子扩增和重测序技术(Circulating Single-Molecule Amplification and Resequencing Technology,c SMART)检测cf DNA基因组5hm C分布特征、拷贝数变异(copy number variation,CNV)特征、核小体(nucleosome footprint,NF)印迹特征、5′末端模体(5′end motif)特征、DNA片段大小(fragment size)特征、以及单碱基替换特征。对比肝癌、肝硬化、健康对照三组人群之间cf DNA的差异特征。3、分析入组人群的cf DNA数据,利用逻辑回归(logistic回归)、最小绝对值收敛和选择算子(Least Absolute Shrinkage and Selection Operator,LASSO)算法、随机森林等机器学习的方法筛选出肝癌特有的特征,回顾性研究初步构建肝癌诊断和筛查模型。4、通过计算模型的灵敏度(sensitivity)、特异性(specificity)、准确率(accuracy)、阳性预测值(positive predictive value,PPV)、阴性预测值(negative predictive value,NPV)、以及绘制受试者工作特征曲线(receiver operating characteristic curve,ROC curve)等方法对模型的性能进行评估。5、在真实世界横断面研究中验证模型性能,并与传统肝癌检测方法的性能进行比较,明确基于cf DNA构建的模型在检测肝癌尤其是早期和极早期肝癌中的优势。6、关注分析过程中筛到的重点分子,进一步利用分子生物学实验深入研究其潜在的功能。7、利用前瞻性数据分析基于外周血的简便检测对肝癌进行风险预警的潜能。针对模型中被误判为肝癌的假阳性肝硬化患者,进行定期随访,监测cf DNA、血清学标志物AFP的动态变化并进行超声以及CT/MRI检查。比较cf DNA假阳性肝硬化患者与cf DNA阴性肝硬化患者三年内转癌的情况,探索基于cf DNA构建的筛查模型是否能较现有筛查手段提前筛出早期肝癌。研究结果:1、低通量WGS与5hm C测序结果显示相比较于肝硬化患者和健康人群,肝癌患者的cf DNA具有转录起始区测序覆盖深度更低、5hm C整体水平更低、DNA片段更小且更多变的特点,同时还具有与肝硬化患者相近但与健康人不同的碱基错配模式。2、非硬化性肝癌患者cf DNA具有独特的核小体印迹(nucleosome footprint,NF)特征。综合分析cf DNA的NF数据、肝癌组织WGS数据、公共数据库数据、以及肝癌小鼠模型,提示MID1IP1在肝癌发生发展中可能发挥重要作用。3、利用c SMART技术检测1185例肝细胞癌和肝硬化患者cf DNA中931处基因位点的突变情况,描绘肝癌、肝硬化患者各自独特的cf DNA基因突变图谱,并筛选出在肝癌组、肝硬化组中突变频率有显著性差异的突变位点。4、使用三个肝癌特异性高频突变位点与血清学标志物AFP、甲胎蛋白异质体比率(AFP-L3)、维生素K缺乏或拮抗剂-II诱导的蛋白质(PIVKA-II)相整合,构建了兼具高灵敏度、高准确性、检测方便等优势的肝癌诊断模型——“Combined method”。5、低通量WGS和5hm C测序对482例肝癌和2074例肝硬化患者的cf DNA进行分析,通过logistic回归和LASSO回归分析筛选特征指标,构建包含5hm C、motif、cf DNA片段大小、NF、CNV五种特征的肝癌筛查模型“Pre Car Score”。6、多中心横断面研究在大规模高风险人群中评估Pre Car Score模型的性能,经验证单独使用Pre Car Score方法相比于超声和AFP可将早期、极早期肝癌的检测灵敏度提升1.2或3.9倍。此外,Pre Car Score模型对超声检查阴性、AFP检测阴性、和PIVKA-II检测阴性的肝癌患者依然具有较高的筛查灵敏度,这表明Pre Car Score模型可以作为现有筛查手段的有力补充。7、通过对Pre Car Score假阳性的肝硬化患者进行为期三年的跟踪随访,发现Pre Car Score阳性的肝硬化人群相较于Pre Car Score阴性肝硬化人群发生肝癌的风险更高,提示Pre Car Score可以提前预警肝癌高风险。结论:本研究采用多中心横断面研究探索肝癌患者独特的cf DNA特征,并基于cf DNA特征构建肝癌诊断模型,模型诊断性能优于现有血清学标志物。我们还构建了Pre Car Score肝癌筛查模型,针对早期、极早期肝癌有很好的检出能力,可作为现有筛查方法超声和AFP的有力补充。此外,我们还在部分高风险人群中前瞻性地证实Pre Car Score模型具有提前预警肝癌发生的效能。综上,本研究建立了基于cf DNA的多指标肝癌诊断和早期筛查模型,为肝癌早期诊断和干预提供了新方法和新策略。