基于GWAS易感基因遗传变异与广东顺德人群原发性肝癌发生风险的关联研究

来源 :南方医科大学 | 被引量 : 0次 | 上传用户:yohoban
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
背景和目的:肝细胞肝癌(hepatocellular carcinoma,HCC)是最常见的肝脏原发性恶性肿瘤,据2015年最新统计,2012年全球新发肝癌患者78.25万,死亡患者74.55万,其发病率和死亡率几乎相等,其中我国肝癌新发和死亡患者数均占全球总数的50%以上,可见其恶性程度之高。近年来肝癌的基础和临床研究不断取得新的进展,但统计表明发病率和病死率均未下降,仍呈逐年升高趋势。肝癌已经成为严重危害我国居民生命和健康的重大公共卫生问题,同时也给国家和地区带来沉重的社会和经济负担。大量的流行病学和实验研究表明,肝癌的发生发展是一个多因素、多阶段的积累过程、由环境因素和遗传因素共同作用的复制过程。目前研究已证实的肝癌环境危险因素主要包括乙型肝炎病毒或丙型肝炎病毒感染、黄曲霉毒素的摄入、嗜酒、吸烟等。20世纪70年开始,广东顺德是我国四大肝癌高发区之一,肝癌死亡率是26.8/10万,仅次于江苏启东、广西扶绥,肝癌死亡率居顺德癌症死因顺位的第一位,但是,和江苏启东、广西扶绥、福建同安三个肝癌高发区已有研究相比,特别是近十年来的研究,顺德肝癌研究比较少,也没有形成系统化研究。在我国,超过80%的肝癌与慢性乙型肝炎相关,但在乙肝患者中只有一小部分罹患肝癌,肝癌存在家族聚集现象,因此,肝癌的发生环境因素是诱因,但遗传因素决定了易感性。研究基因在不同肝细胞中表达的复杂性、基因-基因间的相互作用及这些基因发生突变后的生物学效应是复杂性肝病发生机制研究的重要组成部分,而鉴定与肝病发生相关的基因是首要工作。全基因组关联研究(Genome-Wide Association Studies,GWAS),采用高通量的基因分型平台,检测大样本病例和对照的全基因组水平上的SNPs,并辅以多个独立的人群研究进行后续验证,用于识别参与肿瘤发生的遗传变异,从而阐明肝癌易感性的遗传基础起到了很大的作用。伴随人类基因组计划、国际单体型计划(HapMap)深入进行,以及基因组研究技术的突飞猛进,全基因组关联研究日益成熟,并广泛应用于肿瘤遗传研究。自2010年起,中国、日本、韩国、美国等研究机构在不同人群中相继开展进行了肝癌GWAS研究,发现了多个肝癌易感基因以及遗传变异。总之,肝癌的发生环境因素是诱因,但遗传因素决定了易感性,寻找能早期预测和诊断的特异性遗传标志物,是实现防控肝癌关口前移,降低肝癌发病率的有效措施。本课题选择广东顺德作为现场,采用病例-对照研究策略明确广东顺德地区肝癌高发的流行病学特点;同时综合GWAS研究的最新研究成果,利用生物信息学分析方法,筛选GWAS鉴定的肝癌易感基因的潜在功能遗传变异,开展肝癌遗传关联研究,并系统分析遗传变异与环境因素的交互作用对肝癌的影响,以期识别与肝癌发病相关的潜在功能性遗传变异和重要的基因-基因、基因-环境交互模式;在此基础上,初试顺德肝癌风险预测模型研究的构建,为顺德地区肝癌的防治提供理论参考。材料与方法:本研究采用病例对照研究设计,病例来自于顺德第一人民医院肿瘤科,调查时间从2010年11月到2014年11月,根据临床表现、影像学检查、临床病理、血清标志物等,诊断确诊的新发病例。选取同期入院的耳鼻喉科、神经科、内分泌科等科室的无肿瘤病史患者作为对照,按照年龄(±3岁)和性别与病例进行频数匹配。采用自行设计的流行病学调查问卷,包括:人口学信息20项、个人生活史28项、职业史7项、居住史15项、家族史7项。采取调查对象外周血,用于提取DNA。采用生物信息学技术筛选GRIK1、STAT4、HLA-DQA1和HLA-DQB1基因上的潜在功能遗传变异,运用Sequenom MassArray分型技术对选择的 14 个 SNP(rs2832499、rs363504、rs455804、rs2647073、rs3104369、rs3997872、rs9272219、rs1063355、rs9273363、rs9273651、rs9275319、rs1031507、rs7574865、rs897200)进行分型。问卷信息核查无误后,与SNP数据进行匹配,形成完成的数据库,用于统计分析。计量资料用(?)描述,两组均数比较用t检验,计数资料利用卡方检验比较各因素在两组别的频率分布差异,应用logistic回归模型分析顺德肝癌危险因素。SNP与肝癌的关联分析采用Pearson卡方检验、Cochran-Armitage趋势检验、logistic回归等方法;运用基于logistic回归框架下的相乘和相加模型、MDR法分析遗传变异之间、遗传变异与环境因素之间的交互作用;运用MDR法和logistic回归模型构建肝癌风险预测模型,采取ROC曲线方法对模型的风险预测能力进行评价。所有统计学分析由IBM SPSS19.0、STAT12.0、PHASE 2.1、MDR3.0.2 和 MDR Permutation Testing Module(1.0 beta)等统计软件包完成。结果:本研究调查时间自2010年11月至2014年11月共纳入顺德地区原发性肝癌患者617人,对照组617人,病例组和对照组的平均年龄分别为56.48±11.89、56.38±12.09岁,差异无统计学意义(P=0.883)。病例组和对照组性别比例相同,男性535例(86.71%),女性82例(13.29%),男女性别比例6.5:1。顺德原发性肝癌患病年龄段集中在50-60岁,杏坛、勒流、大良人群发病率较高,高发区与上世纪70年代研究基本一致。经logistic回归模型分析,最终6个因素进入多因素模型:乙型肝炎病毒感染、肝吸虫感染、肝癌家族史、肿瘤家族史、饮酒和饮用沟塘水,经性别、年龄和各因素互相校正后,OR及95%CI分别为20.86(14.99-29.03)、2.48(1.43-4.30)、2.05(1.06-3.97)、1.56(1.04-2.35)、1.54(1.10-2.16)、1.60(1.18-2.17)。对SNP分型结果进行Hardy-Weinberg检验,结果表明除了两个位点rs9272219(P=0.000)、rs1063355(P=0.000),其余 12 个位点的基因型分布均符合Hardy-Weinberg遗传平衡定律,rs3997872和rs9275319的基因型和等位基因分布在病例组和对照组间差异具有统计学意义(P<0.05),而在多因素logistic回归分析未得到有统计学意义结果。GRIK1基因的三个位点间的连锁不平衡程度较弱(rs363504与rs455804:D’=0.183;rs2832499 与 rs455804:D’=0.048;rs363504 与 rs2832499:D’=0.002)。STAT4基因中,rs1031507与rs897200位点间存在连锁不平衡,D’值为1.00,其余位点间的连锁不平衡程度较弱(rs1031507与rs7574865:D’=0.024;rs897200与 rs7574865:D’=0.022)。HLA-DQA1基因的 rs2647073 与 3104369,以及rs3104369与rs3997872位点间均显示存在连锁不平衡,D’值分别为0.998和0.996,rs2647073与rs3997872位点间的连锁不平衡程度较弱,D’值0.442。在HLA-DQB1基因中,rs9273363与rs9275319位点间显示存在连锁不平衡,D’值为0.922,其余位点间的连锁不平衡程度较弱(rs9273363与rs9273651:D’=0.001;rs9273651 与 rs9275319:D’=0.286)。单体型分析GRIK1基因单体型包括ACA、ACG、AAA、AAG和GCA等5种,STAT4基因包括GTA、GCC、TTA、TCC等4种,HLA-DQA1基因包括ATC、ATT、AAC 和 CTC 等 4 种,HLA-DQB1基因包括 CCA、ACA、CTA、ACG 和ATG等5种;基因GRIK1和STAT4单体型构成比两组间差异无统计学意义(P>0.05),单体型趋势检验无统计学意义(P>0.05);HLA-DQA1的AAC单体型的分布在病例组与对照组间存在有统计学意义的差异(P=0.0001),与参考单体型ATC相比,AAC单体型与肝癌低风险相关,OR值及95%CI为0.43(0.28-0.66),且趋势检验具有统计学意义(P=0.0041);HLA-DQB1的ATG单体型的分布在两组中存在统计学意义(P=0.0014),与参考单体型CCA相比,ATG单体型为与肝癌低风险相关,OR值及OR值及95%CI为:0.42(0.25-0.72),且趋势检验具有统计学意义(P=0.0065)。基因-环境交互分析结果显示,CRIK1中rs363504与肝癌家族史的相加交互作用有统计学意义(P=0.0446),与携带rs363504GG+AG基因型的肝癌家族史阴性者相比,携带rs363504 AA基因型的肝癌家族史阳性者肝癌发病风险显著增加,OR值为4.75(95%CI=2.60-8.69);rs2832499与乙肝病毒感染的相乘交互作用有统计学意义(P=0.0135),与携带rs2832499 GG+AG基因型的乙肝病毒感染阴性者相比,携带rs2832499 AA基因型的乙肝病毒感染阳性者肝癌发病风险显著增加,OR 值为 16.04(95%CI=10.06-25.56);5TAT4中rs897200与乙肝病毒感染的相加交互作用有统计学意义(P=0.0360),与携带rs897200GG+AG基因型的乙肝病毒感染阴性者相比,携带rs897200 AA基因型的乙肝病毒感染阳性者肝癌发病风险显著增加,OR值为21.37(95%CI=13.82-33.04);rs7574865与肿瘤家族史的相加交互作用有统计学意义(P=0.0477),与携带rs7574865 GG+AG基因型的肿瘤家族史阴性者相比,携带rs7574865 AA基因型的肿瘤家族史阳性者肝癌发病风险显著增加,OR值为 2.99(95%CI=1.97-4.54);HLA-DQA1中rs3997872与饮酒史的相加交互作用有统计学意义(P=0.0491),与携带rs3997872GG+AG基因型的饮酒史阴性者相比,携带rs3997872 AA基因型的饮酒史阳性者肝癌发病风险显著增加,OR值为3.21(95%CI=1.60-6.44),rs3997872与乙肝病毒感染同时存在相乘交互作用(P=0.0253)、相加交互作用(P=0.0128),与携带rs3997872GG+AG基因型的乙肝病毒感染阴性者相比,携带rs3997872 AA基因型的乙肝病毒感染阳性者肝癌发病风险显著增加,OR值为20.82(95%CI=11.67-37.16);HLA-DQB1中rs9273651与饮酒史的相加交互作用有统计学意义(P=0.0436),与携带rs9273651GG+AG基因型的肝癌饮酒史阴性者相比,携带rs9273651 AA基因型的肝癌饮酒史阳性者肝癌发病风险显著增加,OR值为1.58(95%CI=1.08-2.31);rs9275319与乙肝病毒感染的相加交互作用(P=0.0390)有统计学意义,与携带rs9275319 GG+AG基因型的乙肝病毒感染阴性者相比,携带rs9275319 AA基因型的乙肝病毒感染阳性者肝癌发病风险显著增加,OR值为19.04(95%CI=12.22-29.67),与肿瘤家族史的相加交互作用有统计学意义(P=0.0240),与携带rs9275319 GG+AG基因型的肿瘤家族史阴性者相比,携带rs9275319 AA基因型的肿瘤家族史阳性者肝癌发病风险显著增加,OR值为3.20(95%CI=2.14-4.77)。MDR分析结果显示,基因-基因分析模型共纳入9个SNP因子,产生1-5阶不同交互模型,各因子组合均无统计学意义(P>0.05);基因-环境分析,模型纳入14个因子,产生1-5阶不同交互模型,各因子组合均有统计学意义(P<0.05),最佳模型为rs2832499,rs9273651,rs897200,乙肝病毒感染和肝吸虫感染等五因子(TBA=0.7945,CVC=8/10,permutation P<0.001)。运用logistic回归模型,分别构建了基因因素、环境因素、基因结合环境因素三种肝癌风险预测模型,选择ROC曲线进行评价,曲线下面积(AUC)不同:0.5617、0.7842、0.8344,诊断均有统计学意义(P<0.01),对三种风险预测模型的准确度进行评价,基因结合环境因素预测模型最佳,灵敏度为74.96%,特异度为87.71%,正确指数为0.6267,阳性似然比为6.098,阴性似然比为0.2855。结论:(1)顺德原发性肝癌高发区域与上世纪70年代研究结果基本一致,公共卫生相关部门应重视勒流、杏坛、大良等镇街的原发性肝癌监测工作,顺德原发性肝癌危险因素包括,乙肝病毒感染、乙肝家族史、饮酒、饮用沟塘水、肝吸虫感染和肝癌家族史等方面。(2)所选遗传变异在显性模型、隐性模型、加性模型的多因素logistic回归分析中,未发现有统计学意义结果。在基因-环境交互分析中,rs363504、rs2832499、rs897200、rs7574865、rs3997872、rs9273651、rs9275319 等 7 个遗传变异与肝癌危险因素在统计学上表现出交互作用,体现肝癌形成由环境因素、遗传因素共同影响所致。(3)在顺德人群中,初步建立了肝癌风险预测模型,相比于传统风险因素预测模型,基因结合环境因素构建的肝癌风险预测模型能更好预测肝癌的患病风险,但需要识别更多肝癌相关遗传变异,以完善肝癌风险预测模型。
其他文献
针对发动机转子滚动轴承系统建立了有限元模型,将弹性轴段、刚性圆盘和弹性支承的动力方程集结后得到系统振动方程,分析计算了支承刚度对系统固有频率的影响。将转子不平衡惯
一般来说股价变动的趋势是由股价中包含的信息量决定的,合理的股票价格能满足公司的资源配置需求,帮助公司实现长期稳健的发展。2007年我国股票市场的暴跌事件以及2015年大批股票“同涨同跌”事件最终都导致股价崩盘,给公司和投资者们带来了严重的损失,同时也给监管层也带来了严峻的考验。股价同步性是指个股价格波动与市场平均价格波动间的关联性,我国股价同步性较高的根本原因在于市场中公司的特质信息含量较低,这种
本文采用ordered probit模型对城镇居民在污水处理收费制度改革中的个体特征进行分析,并将居民行为个体分别对城镇缴纳污水处理费意愿和污水处理收费制度改革态度的影响进行
一.目的:探讨全产程中使用硬膜外麻醉分娩镇痛对围产期结局及产后抑郁症发生情况的影响。二.方法:①收集从2019年1月到2019年12月溧阳市人民医院产科病房431例单胎足月阴道分
为了对减速器内轴承的运行状态进行故障监测和诊断,在对振动加速度信号进行小波分析的基础上,提出了基于尺度-能量谱的特征提取和模糊聚类相结合的滚动轴承故障诊断方法。该
随着政策的出台如《中国制造2025》实施制造强国战略行动纲领发布,习近平主席提出实现中华民族伟大复兴,供应链的创新与应用上升为国家战略的政策,越来越多的电子行业OEM/ODM
目的:自20世纪80~90年代以来,各种不同类型的无细胞百日咳疫苗已在各国批准上市[1]。其免疫效果已被证实,不良反应比菌体疫苗明显较低,但成本比菌体疫苗高很多,而百日咳菌的
处于晋西北的边城岢岚,作为治所出现较晚且名称多次变更。因其地理位置,多以晋西北的军事重镇出现在历史上,尤其是北部边患严重的宋、明时期,其军事防御工程多有修筑。岢岚也
在网络新媒体时代,治理模式的改变与互联网的发展密切相关,互联网监督促使着政府管理方式的调整和国家治理模式的兴起。文章把互联网监督纳入到国家治理体系中进行考察。互联
建立贴体曲线网格水动力数学模型模拟长江太仓段潮流特性。在此基础上,针对码头油废水排放和成品油泄漏两种典型油污染事故分别采用不同的模式进行模拟预测,成品油泄漏采用费