论文部分内容阅读
随着人类基因组计划的完成,研究的重点由结构基因组学转向功能基因组学,即人类基因组研究的目的不再只是为了读出全部的DNA序列,更重要的是读懂每个基因的功能,每个基因与某种疾病的关系,真正对生命进行系统地科学解码。因此,为了破解基因功能,如何对海量的基因组数据进行分析显得至关重要。本文主要进行转录因子结合位点和遗传病基因突变的全基因组分析。随着生物信息学的快速发展,对转录因子结合位点的研究已经成为热点问题之一。转录因子调控基因转录,是基因表达调控的关键步骤,分析转录因子结合位点对研究转录因子调控系统有着重要意义。本文在完成TWIST染色质免疫沉淀测序(Chromatin Immunoprecipitation-sequencing, ChIP-seq)的基础上,通过优选的BSMM流程,在全基因组上完成TWIST结合位点及E-box的分析,得到了26229个TWIST结合位点和90659个E-boxes。重点分析了6号染色体,得到了1936个结合位点和6437个E-boxes,并对6号染色体上的结合位点在启动子区域的基因进行了功能注释和预测。视网膜色素变性(Retinitis Pigmentosa, RP)是一种常见的孟德尔遗传疾病。它是由单基因突变引起的,在人群中发生的比例约为1/3500。目前已经发现了52个这种疾病的致病基因。本文在完成全外显子测序(Whole Exon Sequencing,WES)的基础上,通过优选的BSGA流程,在全基因组上完成了106个RP样本的数据分析,总共获得了297577个突变,其中平均每个样本有2807个突变。利用现有的基因数据库和文献,对前面发现的突变进行过滤,找到了所有可能的致病基因突变。此外,还发现了4处新的候选致病基因突变。本文的研究是基于美国贝勒医学院Rui Chen实验室的视网膜研究基金,使用Illumina平台进行测序,并在Linux平台上完成数据分析。分析结果表明,应用BSMM流程分析TWIST ChIP-seq数据得到的结果,为进一步的功能实验验证提供了科学依据,且为TWIST调控提供了候选调控的靶基因;应用BSGA流程分析外显子测序数据为筛查罕见遗传病中难以发现的致病基因的突变提供了分析方法,为进一步进行疾病的临床诊断及基因治疗等应用提供了候选的致病基因。