论文部分内容阅读
目的
肺癌是全球范围内最常见的恶性肿瘤之一,目前其致死率居于各种恶性肿瘤之首,给世界人民带来了沉重的经济和疾病负担。肺癌是多种因素共同作用的结果,但生活方式与遗传风险对肺癌发生风险的具体作用需要进一步来量化。医疗信息技术和大数据技术的发展,为肺癌风险因素的全面认识与肺癌的精准预防提供了新的思维与机遇。本研究围绕着生活方式、遗传风险与肺癌的关联分析与防控管理,基于多源数据库来识别肺癌的关键因素,并对其进行分层分级。通过大型队列来评估生活方式因素、遗传易感性对肺癌发生风险的效应大小,以及它们的不同组合的效应。基于生活方式因素、遗传因素与其它传统肺癌风险因素构建肺癌发生风险预测模型并评估其预测效能。探索肺癌高危人群精准防控管理模式的构建,评价肺癌高危人群精准防控管理模式对肺癌的预防效果,并提出肺癌防控管理策略优化的政策建议。
方法
基于LD-hub与英国生物样本库(UKbiobank,UKB)两个多源数据库运用遗传方差分析器(geneticcovarianceanalyzer,GNOVA),通过遗传相关性分析方法对肺癌关键风险因素进行识别、分层分类。运用Cox比例风险回归模型对2006-2017年期间UKB大型队列究的调查资料和基因型数据进行分析,评估生活方式因素与遗传因素对肺癌发生风险的危害比(hazardratio,HR)。通过全基因组关联分析研究(genome-wideassociationstudy,GWAS)来识别肺癌风险基因位点。基于fastGWA模型,在遗传加性效应模式下,通过线性回归模型来评估全基因组范围内每个单核苷多态性(singlenucleotidepolymorphism,SNP)与肺癌之间的关联。通过多基因预测模型(PRS-CS )来构建个体的肺癌多基因风险评分(polygenetic risk score,PRS)以评估个体肺癌遗传易感性。通过构建健康生活方式指数评分来评估个体生活方式的类型以及对健康生活方式依从性。在Cox比例回归模型中加入生活方式变量与遗传风险的交互项来评估生活方式与遗传风险对肺癌发生风险的联合效应与交互作用。基于Cox比例风险回归预测模型,综合生活方式因素与遗传因素来构建肺癌发生风险预测模型。通过反事实分析与人群归因分值(population attributablefraction,PAF)的方法,来评估生活方式对不同肺癌遗传风险人群肺癌发生风险的影响与归因疾病负担。通过场景模拟分析,来评估生活方式对不同肺癌遗传风险人群的预防效果。
结果
本研究基于多源数据库识别了199个肺癌的关键因素。在行为因素中当前吸烟与肺癌的相关性最为显著(遗传相关性系数绝对值|r|=0.48,P=3.4×10-52),身体活动、饮食以及饮酒均与肺癌有着显著的相关性。在代谢性风险因素中,腰围与肺癌的相关性最为显著(|r|=0.18,P=1.1×10-14)。一级亲属患肺癌与肺癌的相关程度较高,相关系数的绝对值高达0.91(P=9.5×10-18)。全基因组关联分析发现了6个先前研究未曾报道的肺癌风险基因位点,分别为RP11-202K23.1基因上的rs145484481位点(oddratio,OR:1.01,P=5.6×10-9)、CDH12基因上的rs139804501位点(OR:1.01,P=5.6×10-10)、HYKK基因上的rs11852372位点(OR:1.001,P=2.1×10-10)、CEMIP基因上的rs116253640位点(OR:1.05,P=1.5×10-8)、LINC00511基因上的rs145788203位点(OR:1.01,P=7.9×10-9)、CCBE1基因上的rs535360667位点(OR:1.02,P=9.2×10-9)。评估的肺癌倾向性遗传度为12%。经多混杂因素调整后的Cox比例风险回归分析结果显示,不吸烟、常规的体力活动、健康的饮食模式、适度饮酒、非中心肥胖分别可降低80%(HR:0.20,95% CI:0.18,0.22)、13%(HR:0.87,95% CI:0.78,0.96)、23%(HR:0.77,95%CI:0.67,0.86)、13%(95%CI:0.78,0.98)、21%(HR:0.79,95%CI:0.70,0.89)的肺癌发生风险。健康生活方式指数评分与肺癌多基因风险评分均是肺癌发生风险的独立风险因素。健康生活生活方式得分最高的个体肺癌发生的风险与健康生活方式得分最低的个体相比,肺癌发生风险可降低88%(HR:0.12,95% CI:0.08,0.17)。肺癌高遗传易感性人群发生肺癌的风险是低遗传易感性人群的1.98倍(HR:1.98,95% CI:1.66, 2.37)。高遗传风险人群中不利的生活方式与低遗传风险人群的有利生活方式相比,肺癌发生风险增加了8.03倍(HR:9.03,95%CI:6.39,12.77)。未发现生活方式与遗传风险对肺癌发生风险存在显著性的交互作用(P>0.05)。加入遗传信息可以改善肺癌发生风险的预测效能(AUC=0.79)。五个生活方式因素联合可解释高遗传风险人群中87.6%的肺癌发生(PAF:87.6%,95%CI:76.5%,94.1%)、中等遗传风险人群中71.6%的肺癌发生(PAF:71.6%,95%CI:58.3%,82.4%),低遗传风险人群中75.0%的肺癌发生(PAF:75.0%,95% CI:38.6%,89.7%)。提高健康生活方式依从性,可显著减少高遗传风险人群中76.0%的肺癌发生(PAF:76%,95%CI:67.1%,82.6%)、中等遗传风险人群中70.6%(PAF:70.6%,95%CI:63.7%,76.1%)、低遗传风险人群中67.0%的肺癌发生(PAF:67.0%,95%CI:46.0%,79.9%)。场景仿真分析结果表明经过两年精准生活方式干预后,无论遗传风险如何,肺癌发生风险均可大幅度降低。
结论
本研究基于多源数据识别出了199个肺癌相关的风险因素,进一步验证了肺癌是多种因素共同作用的结果。不吸烟、适度饮酒、常规体力活动、健康饮食、非中心性肥胖均可显著降低肺癌的发生风险,是肺癌的独立保护因素。肺癌全基因组关联分析识别出6个先前研究未曾报道的肺癌风险基因位点,评估的肺癌倾向遗传度为12%,支持肺癌具有遗传易感性。生活方式与遗传易感性对肺癌发生风险没有显著的交互作用,生活方式和肺癌遗传易感性与肺癌发生风险独立相关。在每个遗传风险层面,健康的生活方式都与相似程度的肺癌风险降低有关,强调每个人都应坚持健康生活方式。健康生活方式在一定程度上可以抵消高遗传易感性对肺癌的风险。高遗传风险人群能从生活方式干预中获得最大的风险降低,可将高遗传风险人群作为生活方式干预的首要目标人群。精准的吸烟干预、饮酒干预、饮食干预、运动干预、中心性肥胖干预可明显降低肺癌发生风险。生活方式精准干预与提高健康生活方式依从性对肺癌的预防具有重要的公共卫生意义与应用价值。
肺癌是全球范围内最常见的恶性肿瘤之一,目前其致死率居于各种恶性肿瘤之首,给世界人民带来了沉重的经济和疾病负担。肺癌是多种因素共同作用的结果,但生活方式与遗传风险对肺癌发生风险的具体作用需要进一步来量化。医疗信息技术和大数据技术的发展,为肺癌风险因素的全面认识与肺癌的精准预防提供了新的思维与机遇。本研究围绕着生活方式、遗传风险与肺癌的关联分析与防控管理,基于多源数据库来识别肺癌的关键因素,并对其进行分层分级。通过大型队列来评估生活方式因素、遗传易感性对肺癌发生风险的效应大小,以及它们的不同组合的效应。基于生活方式因素、遗传因素与其它传统肺癌风险因素构建肺癌发生风险预测模型并评估其预测效能。探索肺癌高危人群精准防控管理模式的构建,评价肺癌高危人群精准防控管理模式对肺癌的预防效果,并提出肺癌防控管理策略优化的政策建议。
方法
基于LD-hub与英国生物样本库(UKbiobank,UKB)两个多源数据库运用遗传方差分析器(geneticcovarianceanalyzer,GNOVA),通过遗传相关性分析方法对肺癌关键风险因素进行识别、分层分类。运用Cox比例风险回归模型对2006-2017年期间UKB大型队列究的调查资料和基因型数据进行分析,评估生活方式因素与遗传因素对肺癌发生风险的危害比(hazardratio,HR)。通过全基因组关联分析研究(genome-wideassociationstudy,GWAS)来识别肺癌风险基因位点。基于fastGWA模型,在遗传加性效应模式下,通过线性回归模型来评估全基因组范围内每个单核苷多态性(singlenucleotidepolymorphism,SNP)与肺癌之间的关联。通过多基因预测模型(PRS-CS )来构建个体的肺癌多基因风险评分(polygenetic risk score,PRS)以评估个体肺癌遗传易感性。通过构建健康生活方式指数评分来评估个体生活方式的类型以及对健康生活方式依从性。在Cox比例回归模型中加入生活方式变量与遗传风险的交互项来评估生活方式与遗传风险对肺癌发生风险的联合效应与交互作用。基于Cox比例风险回归预测模型,综合生活方式因素与遗传因素来构建肺癌发生风险预测模型。通过反事实分析与人群归因分值(population attributablefraction,PAF)的方法,来评估生活方式对不同肺癌遗传风险人群肺癌发生风险的影响与归因疾病负担。通过场景模拟分析,来评估生活方式对不同肺癌遗传风险人群的预防效果。
结果
本研究基于多源数据库识别了199个肺癌的关键因素。在行为因素中当前吸烟与肺癌的相关性最为显著(遗传相关性系数绝对值|r|=0.48,P=3.4×10-52),身体活动、饮食以及饮酒均与肺癌有着显著的相关性。在代谢性风险因素中,腰围与肺癌的相关性最为显著(|r|=0.18,P=1.1×10-14)。一级亲属患肺癌与肺癌的相关程度较高,相关系数的绝对值高达0.91(P=9.5×10-18)。全基因组关联分析发现了6个先前研究未曾报道的肺癌风险基因位点,分别为RP11-202K23.1基因上的rs145484481位点(oddratio,OR:1.01,P=5.6×10-9)、CDH12基因上的rs139804501位点(OR:1.01,P=5.6×10-10)、HYKK基因上的rs11852372位点(OR:1.001,P=2.1×10-10)、CEMIP基因上的rs116253640位点(OR:1.05,P=1.5×10-8)、LINC00511基因上的rs145788203位点(OR:1.01,P=7.9×10-9)、CCBE1基因上的rs535360667位点(OR:1.02,P=9.2×10-9)。评估的肺癌倾向性遗传度为12%。经多混杂因素调整后的Cox比例风险回归分析结果显示,不吸烟、常规的体力活动、健康的饮食模式、适度饮酒、非中心肥胖分别可降低80%(HR:0.20,95% CI:0.18,0.22)、13%(HR:0.87,95% CI:0.78,0.96)、23%(HR:0.77,95%CI:0.67,0.86)、13%(95%CI:0.78,0.98)、21%(HR:0.79,95%CI:0.70,0.89)的肺癌发生风险。健康生活方式指数评分与肺癌多基因风险评分均是肺癌发生风险的独立风险因素。健康生活生活方式得分最高的个体肺癌发生的风险与健康生活方式得分最低的个体相比,肺癌发生风险可降低88%(HR:0.12,95% CI:0.08,0.17)。肺癌高遗传易感性人群发生肺癌的风险是低遗传易感性人群的1.98倍(HR:1.98,95% CI:1.66, 2.37)。高遗传风险人群中不利的生活方式与低遗传风险人群的有利生活方式相比,肺癌发生风险增加了8.03倍(HR:9.03,95%CI:6.39,12.77)。未发现生活方式与遗传风险对肺癌发生风险存在显著性的交互作用(P>0.05)。加入遗传信息可以改善肺癌发生风险的预测效能(AUC=0.79)。五个生活方式因素联合可解释高遗传风险人群中87.6%的肺癌发生(PAF:87.6%,95%CI:76.5%,94.1%)、中等遗传风险人群中71.6%的肺癌发生(PAF:71.6%,95%CI:58.3%,82.4%),低遗传风险人群中75.0%的肺癌发生(PAF:75.0%,95% CI:38.6%,89.7%)。提高健康生活方式依从性,可显著减少高遗传风险人群中76.0%的肺癌发生(PAF:76%,95%CI:67.1%,82.6%)、中等遗传风险人群中70.6%(PAF:70.6%,95%CI:63.7%,76.1%)、低遗传风险人群中67.0%的肺癌发生(PAF:67.0%,95%CI:46.0%,79.9%)。场景仿真分析结果表明经过两年精准生活方式干预后,无论遗传风险如何,肺癌发生风险均可大幅度降低。
结论
本研究基于多源数据识别出了199个肺癌相关的风险因素,进一步验证了肺癌是多种因素共同作用的结果。不吸烟、适度饮酒、常规体力活动、健康饮食、非中心性肥胖均可显著降低肺癌的发生风险,是肺癌的独立保护因素。肺癌全基因组关联分析识别出6个先前研究未曾报道的肺癌风险基因位点,评估的肺癌倾向遗传度为12%,支持肺癌具有遗传易感性。生活方式与遗传易感性对肺癌发生风险没有显著的交互作用,生活方式和肺癌遗传易感性与肺癌发生风险独立相关。在每个遗传风险层面,健康的生活方式都与相似程度的肺癌风险降低有关,强调每个人都应坚持健康生活方式。健康生活方式在一定程度上可以抵消高遗传易感性对肺癌的风险。高遗传风险人群能从生活方式干预中获得最大的风险降低,可将高遗传风险人群作为生活方式干预的首要目标人群。精准的吸烟干预、饮酒干预、饮食干预、运动干预、中心性肥胖干预可明显降低肺癌发生风险。生活方式精准干预与提高健康生活方式依从性对肺癌的预防具有重要的公共卫生意义与应用价值。