论文部分内容阅读
全基因组关联研究(Genome-wide Association Studies,GWASs)已在世界不同人群中广泛开展,为识别与复杂疾病/性状相关的单核苷酸多态性(Singlenucleotide Polymorphisms,SNPs)提供了有效方法。但是迄今为止,缺血性脑卒中(Ischemic stroke,IS)和血脂异常(Dyslipidemia,DL)所识别的SNPs只能解释其很小一部分的遗传可能性。尽管大量研究表明DL是IS发生的重要危险因素且两个表型具有共同的遗传风险因子,但两者之间的遗传共通性(遗传多效性)在很大程度上仍然未知。为此,本研究拟把基因多效性条件错误发现率(Conditional False Discovery Rate,cFDR)方法应用于GWASs汇总数据研究,以进一步识别与IS和DL相关的遗传变异。目的识别与IS和DL(包括总体胆固醇(Total cholesterol,TC)、高密度脂蛋白胆固醇(High-density lipoprotein cholesterol,HDL-C)、低密度脂蛋白胆固醇(Lowdensity lipoprotein cholesterol,LDL-C)及甘油三酯(Triglyceride,TG))相关联的新的SNPs位点及多效性位点。方法基于IS和HDL-C、LDL-C、TC、TG的GWASs汇总数据,运用cFDR方法计算其相关SNPs的cFDR及conjunction cFDR值,用分层Q-Q图和富集倍数图评估两者间多效性基因富集程度,用条件曼哈顿图对关联SNPs在染色体上的位置进行可视化,使用DAVID数据库对识别出的注释基因位点进行功能术语富集分析和通路分析。结果1、分层Q-Q图和富集倍数图显示:IS与HDL-C、LDL-C、TC、TG之间均具有较高程度的多效性基因富集。2、cFDR<0.05标准下发现:14个SNPs与IS有关联,其中10个为新发现的SNPs;660个SNPs与HDL-C、LDL-C、TC及TG相关联,其中324个为新发现的SNPs。3、多效性位点分析共发现:10个多效性SNPs,其中7个鉴定为新发现,共注释在12个多效性基因上,其中9个多效性基因为新发现。4、功能基因富集和通路分析结果显示:大多数基因在脂蛋白代谢过程、脂质稳态、碳水化合物代谢过程和胆固醇平衡通路上发挥作用。结论1、在IS和DL的遗传变异识别研究中,条件Q-Q图和富集倍数图显示两者有较好的多效性基因富集情况,印证了IS与HDL-C、LDL-C、TC、TG均有关联性。2、应用cFDR方法发现10个新SNPs与IS相关,324个新SNPs与DL相关,相关基因已在GO功能富集分析和KEGG分析中得到了部分功能验证。3、新发现7个多效性SNPs和9个多效性遗传基因,可能会有助于获得关于IS与DL之间的共享生物学机制新见解。这对两种疾病的联合预测有重要意义。