论文部分内容阅读
基因组变异对个体表型有重要影响,单核苷酸多态性(简称SNP)是一类常见的可遗传的基因组变异,一些SNP被发现与疾病表型关联。SNP的形成与DNA突变、DNA损伤修复等关联。真核DNA以染色质的形成存在。核小体是染色质的基本构成单元,核小体位置、DNA甲基化和组蛋白修饰等因素影响染色质结构的状态。研究基因组变异与核小体、染色质之间的相互作用,对于理解基因组变异的分布、变异与疾病关联机制等有重要价值。本文在人类基因组中,对以下问题开展了分析:不同类型的SNP位点相对核小体的分布是否有差异?SNP位点的分布是否与组蛋白修饰关联?疾病关联SNP的分布有何特征?重要的结果如下: 首先,不同类型SNP相对于核小体、组蛋白修饰,具有不同的分布模式。我们将SNP划分为9类SNP(同义SNP、错义SNP、无义SNP、移码SNP、邻近基因3端SNP、邻近基因5端SNP、3非翻译区SNP、5非翻译区SNP和内含子SNP)。利用人类基因组核小体位置数据和组蛋白修饰数据,计算了不同类型SNP位点周围的核小体分布模式和组蛋白修饰分布模式。结果表明,虽然总体上,所有SNP倾向于分布在核小体上,但是不同类型SNP位点周围核小体分布具有不同的模式,且组蛋白修饰分布的模式也不同。位于编码区的SNP倾向于发生在核小体上和富含抑制性的组蛋白修饰;位于内含子区域、基因间区、3非翻译区SNP则更多的出现在核小体缺失区域且缺少各种组蛋白修饰。 其次,疾病关联SNP位点周围的染色质具有特殊的特征。我们将疾病关联SNP分为编码区疾病关联SNP和非编码区疾病关联SNP。将获取的中性SNP(把同义SNP当作中性SNP)作为参照。分别计算三类SNP位点周围的核小体分布模式,组蛋白修饰、DNA甲基化和GC含量的分布模式。我们发现,疾病关联SNP位点周围存在明显的核小体占据。非编码区疾病关联SNP位点周围富含各种组蛋白修饰,并且编码区疾病关联SNP位点周围组蛋白修饰水平与中性SNP位点周围组蛋白修饰水平相当。非编码区疾病关联SNP位点周围的DNA甲基化水平和GC含量水平明显低于中性SNP位点周围水平。 最后,计算了调控位点结合区域内(转录因子结合位点和miRNA靶位点)的SNP位点与核小体分布的关系。调控位点结合区域SNP位点周围核小体水平低,且靶位点周围SNP频率水平低。另外,我们的结果还表明,体细胞突变更多地发生在SNP位点周围+1 bp和-1 bp位置上。 本文系统地分析了人类基因组中不同类型SNP位点周围染色质结构的特征,这些分析对于理解基因组变异与染色质结构之间的相互作用具有重要价值。