论文部分内容阅读
目的:注意缺陷多动障碍(Attention deficit hyperactivity disorder,ADHD)是儿童青少年时期最常见的神经发育障碍之一。作为一种多病因的复杂疾病,其平均遗传度高达74%,目前全基因组关联研究(Genome-wide association study,GWAS)识别的遗传变异仅可解释其22%的遗传度,且这些易感遗传变异主要位于基因的非编码区,其作用机制通常难以阐明。因此,本研究基于全转录组关联策略,系统识别与ADHD发病风险相关的调控型遗传变异,并探索其在ADHD发生中的生物学机制,为ADHD高危人群的筛查和个体化防治提供理论依据。方法:(1)利用源自Genotype-Tissue Expression、Common Mind Consortium等数据库的20个ADHD相关脑组织和非脑组织部位的基因表达-遗传变异权重数据集和ADHD GWAS汇总统计数据,采用全转录组关联研究(Transcriptome-wide association study,TWAS)分析整合基因组、转录组和疾病表型信息,并采用基于汇总数据的孟德尔随机化(Summary data-based Mendelian randomization,SMR)分析进行验证和补充,在全转录组范围内识别顺式遗传调控表达成分与ADHD发病风险相关的基因,再通过多个数据库和注释工具的功能注释,筛选调控易感基因表达的功能性遗传变异。(2)采用多中心两阶段病例-对照设计,研究候选遗传变异与中国儿童ADHD发病风险的关联。以美国《精神障碍诊断和统计手册》第四版(The fourth edition of the Diagnostic and Statistical Manual of Mental Disorders,DSM-IV)为诊断标准,发现阶段在湖北武汉共招募543名ADHD新发患儿和560名对照儿童;验证阶段在湖南长沙共招募316名ADHD新发患儿和332名对照儿童。采用Swanson,Nolan,and Pelham-IV(SNAP-IV)评定量表和视听整合持续性操作测验(Integrated Visual and Auditory Continuous Performance test,IVA-CPT)评估ADHD的临床症状;采用调查问卷收集研究对象的个人情况、家庭情况、母孕期情况等信息;采集研究对象的静脉血。应用Sequenom Mass ARRAY进行基因分型。采用非条件Logistic回归分析不同遗传模型中遗传变异与ADHD发病风险的关联,采用方差分析比较不同基因型间临床特征的差异。采用非条件Logistic回归筛选与ADHD相关的环境因素,进一步应用分类决策树、广义多因子降维(Generalized multi-factor dimensionality reduction,GMDR)分析多因素基因-环境交互作用。此外,采用Logistic回归及相加交互作用分析excel表分析两因素基因-基因和基因-环境相乘及相加交互作用。(3)采用双荧光素酶报告基因实验探究阳性关联位点rs3768046对靶基因TIE1启动子活性的影响,并应用电泳迁移率实验(Electrophoretic mobility shift assay,EMSA)分析其对核蛋白结合力的影响。采用双荧光素酶报告基因实验探究阳性关联位点rs1054037对hsa-mi R-5591-3p与MANBA靶序列结合的影响。此外,采用实时荧光定量PCR技术分别检测20例ADHD病例和20例对照外周血靶基因TIE1和MANBA的RNA表达水平。结果:(1)TWAS在全转录组范围内共识别了38个ADHD易感基因,且关联信号主要集中在1号、4号和11号染色体上。SMR共识别了5个ADHD易感基因且关联信号位于在1号、4号和11号染色体上。综合TWAS、SMR及功能注释等多项生物信息学分析结果,最终筛选出位于1号、4号和11号染色体上的8个蛋白编码基因及调控其表达的32个目标遗传变异。(2)两阶段病例对照研究结果显示,TIE1 rs3768046与MANBA rs1054037在发现阶段、验证阶段和合并阶段均与ADHD发病风险显著相关。在合并阶段,TIE1rs3768046(G>A)在共显性模型、显性模型和加性模型中均与ADHD发病风险降低显著相关(共显性模型,GA vs GG:OR=0.64,95%CI:0.52-0.80,PFDR<0.001;显性模型,GA+AA vs GG:OR=0.63,95%CI:0.51-0.78,PFDR<0.001;加性模型,AA vs GA vs GG:OR=0.68,95%CI:0.56-0.81,PFDR<0.001),且rs3768046不同基因型SNAP-IV量表注意缺陷和多动/冲动得分、IVA-CPT视觉、综合和听觉注意力商数得分均存在显著的统计学差异(PFDR<0.05)。MANBA rs1054037(C>T)在共显性模型、显性模型和加性模型中均与ADHD发病风险增高显著相关(共显性模型,TC vs CC:OR=1.51,95%CI:1.23-1.86,PFDR<0.001,TT vs CC:OR=1.61,95%CI:1.20-2.15,PFDR=0.002;显性模型,TT+TC vs CC:OR=1.53,95%CI:1.26-1.86,PFDR<0.001;加性模型,TT vs TC vs CC:OR=1.32,95%CI:1.15-1.52,PFDR<0.001),且rs1054037不同基因型SNAP-IV量表多动/冲动得分、IVA-CPT视觉、综合和听觉反应控制商数得分均存在显著的统计学差异(PFDR<0.05)。未发现rs3768046与rs1054037间存在显著的相乘或相加交互作用(P>0.05)。Logistic回归分析显示,父亲文化程度低(OR=1.29,95%CI:1.05-1.59,P=0.017)、母亲孕前超重或肥胖(OR=1.55,95%CI:1.21-2.00,P=0.001)、早产(OR=1.98,95%CI:1.32-2.98,P=0.001)及儿童期特应性疾病(OR=1.35,95%CI:1.05-1.73,P=0.019)是ADHD的危险因素。多因素交互作用分析结果显示,包含rs3768046基因型、母亲孕前超重或肥胖和儿童期特应性疾病的分类决策树模型具有最佳的预测性能;GMDR分析显示rs3768046基因型、母亲孕前超重或肥胖、儿童期特应性疾病和早产等属性组合是最佳的交互作用模型。两因素交互作用分析结果显示,母亲孕前超重或肥胖与rs3768046存在相乘交互作用(P=0.048),与携带rs3768046 AA/GA基因型、母亲孕前未超重的儿童相比,携带rs3768046 GG基因型且母亲孕前超重或肥胖的儿童患ADHD的风险增高1.70倍(OR=2.70,95%CI:1.89-3.84,P<0.001)。(3)双荧光素酶报告基因实验发现,rs3768046 G等位基因增强TIE1的启动子活性;EMSA显示rs3768046可能以等位基因特异性方式结合某些转录因子从而改变TIE1的表达。双荧光素酶报告基因实验还发现,rs1054037(C>T)破坏了hsa-mi R-5591-3p与MANBA靶序列的结合,进而上调靶基因的表达。此外,ADHD病例组外周血中TIE1(P=0.001)和MANBA(P=0.019)的表达水平显著高于对照组。结论:基于全转录组关联策略在全转录组范围内识别ADHD易感基因,其中TIE1rs3768046、MANBA rs1054037与中国儿童ADHD发病风险显著相关,且rs3768046与母亲孕前超重或肥胖存在交互作用。rs3768046可能通过影响转录因子与TIE1启动子区域的结合从而调控转录活性;rs1054037可能通过影响micro RNA与靶序列的结合从而改变MANBA基因的表达水平,进而增加ADHD的发病风险。