论文部分内容阅读
微卫星序列最初是由于能引发多种人类神经性疾病而“享誉盛名”,后来被作为分子标记广泛应用于生物学领域。然而,无论是实验生物学,还是计算生物学,对微卫星序列的相关研究主要是针对基因组较大的生物,如真核生物和原核生物。病毒是一类微小的生命体,在自然环境中无法存活,靠寄生在活细胞内延续生命。目前,病毒中微卫星序列的相关报道相当有限。本论文利用现有的基因组和核酸序列公共数据库资源,借助数学的、统计学的和计算机的手段,对真核生物、原核生物和病毒基因组序列中的微卫星序列,尤其是病毒基因组中的微卫星序列进行比较分析,并探讨微卫星序列在病原体和宿主的感染与防御机制中可能发挥的作用。本论文内容主要涉及以下方面:1.从病毒到人类所有进化等级上的生物体序列中微卫星序列的比较分析(第2章)本研究工作的材料是包括多种模式生物在内的32种生物,涵盖动物、植物、真菌、原生生物、真细菌、古细菌和病毒,分析了其中微卫星序列的分布情况,并探讨了微卫星序列在基因组组成和扩增中可能发挥的作用。研究发现,无论是处于进化最低层的病毒,还是处于进化最高层的智人,其序列中微卫星的含量基本都达到了60%,更有甚者,间日疟原虫(D. discoideum)中微卫星序列含量竟有75%之多。由此说明,微卫星序列在基因组组成上做出了相当大的贡献。也从侧面证明,基因组有形成短串联重复片段的倾向,重复的发生为基因组由小到大的进化提供了一种动力。然而,重复片段的迭代次数不是无限制增大的,因此作者在这里引进了一个概念一—压力边界,主要是针对动植物的,是重复序列无限制扩增需要突破的一个长度界限。动物、植物、基因组较大的原生动物中重复序列的选择压力边界大概为12bp,剩下的原生生物和真菌中重复序列的压力边界大概为10bp,而细菌中重复序列的压力边界大概为8bp。总之,短串联重复序列是造成基因组变异的一个重要因素。2.病毒基因组中微卫星序列分析研究(第3—6章)作者站在整个病毒的高度上,从1938种病毒中选取了257个代表种。由于其基因组呈现出非常丰富的长度多态性,因此为研究微卫星序列和基因组大小的相关性提供了一个极为难得的材料。结果表明基因组大小是影响微卫星序列重复水平的一个重要因素,两者之间存在着很强的正相关关系。整体上,基因组越大,其呈现出来的容纳重复序列的能力就越强。除此之外,宿主可能在一定程度上也影响了微卫星序列的含量。比如,相似大小的病毒基因组,感染脊椎动物和非脊椎动物的病毒比感染细菌的病毒有较高含量的微卫星序列。这些感染脊椎动物和非脊椎动物的病毒相比较感染其它宿主的病毒,其基因组较大。作者推测,可能是在侵染过程中病毒由于整合了宿主的部分序列,其基因组序列变的较长,微卫星序列的含量升高。从进化学的角度看,这是病毒和其宿主在长期的侵染与防御过程中互相选择的结果,换而言之,这是微卫星序列重复水平与基因组大小、病毒与其宿主协同进化的结果。病毒是一大类病原体,微卫星序列具有高突变率、稳定性差的特点,因此对病毒中微卫星序列的透彻研究对将来了解许多宿主的发病机理有很大帮助。(第3章)本论文第4章采用第3章的数据集,从另外的角度进行分析。主成分分析的结果显示,造成病毒间微卫星序列多样性的最大因素是重复单元较短的微卫星序列(mono-~etra-SSRs,记作SSRs1~4),其次是重复单元相对较长的微卫星序列(主要是hexa-,记作SSRs6)。作者通过文献调研,惊奇的发现,在原核生物中,SSRs1~4主要存在于宿主依赖性的病原体微生物中,这类微生物的基因组通常相对较小,它们一旦脱离了宿主,在自然环境下不易存活。相反,SSRs5~11主要存在于非致病性原核微生物的和条件致病菌中,这类原核生物的基因组相对来说比较大。本章的病毒基因组通常比原核生物的基因组小很多,因此SSRs1~4相对较多,并未发现很多SSRs>5。作者分析,SSRs>5在绝大多数病毒中都不存在的可能原因如下:(i)基因组较小,容纳较长重复单元的能力不足;(ii)突变的偏好性促使个别病毒中扩增出SSRs>5;(iii)绝大多数病毒对SSRs>5没有很强的负向选择性。(第4章)为了调查甲型流感病毒中的微卫星序列,本论文第5章基于全基因组序列的完整性,选取了85个亚型的甲型流感病毒基因组作为数据材料,通过配对设计两样本的均值差异显著性t检验法和统计学作图评估了自然序列和随机模型生成序列中微卫星序列的差异,发现无论是节段性比较,还是整个基因组比较,自然序列和随机生成的序列中微卫星的差异均达到了极显著的水平,而且甲型流感病毒的第7个节段中微卫星序列严重低于期望值,其它节段的均高于期望值。运用回归分析的方法分析了微卫星序列的含量和迭代次数之间的相关性,发现两者之间呈明显的负相关。作者也跟前辈们的结果做了比较,并讨论了短串联重复序列在病毒基因组多样性方面可能发挥的作用。结果表明,重复序列广泛分布于甲型流感病毒的各个节段,而且其在各节段中是均匀存在,几乎没有发现堆积现象。甲型流感病毒基因组的遗传多样性主要是由于基因组节段间的重配和节段内序列的变异,其中,微卫星序列是造成节段内序列变异的一个重要因素。微卫星序列在各节段中的超比例或不足的分析结果可能会为重配机制、感染过程和进化分析提供一些新的蛛丝马迹。(第5章)本论文第6章分析了微卫星序列在植物病毒——马铃薯病毒属的45个病毒种中的相对密度、相度丰度和碱基组成,并和艾滋病病毒(HIV)的相关数据做了比较。研究发现,各病毒基因组中微卫星序列的相对密度和相对丰度均非常相似,这种现象在HIV的各病毒株间也是同样存在。马铃薯属病毒和HIV,都是致病性的RNA病毒,有着相似的基因组大小、基因组结构、微卫星序列相对密度、相对丰度和碱基组成。其中最大的一个不同是它们所感染的宿主,马铃薯属病毒通常感染的是植物,而HIV则主要是攻击人类。尽管如此,它们的相同性证明微卫星序列绝非是偶然,马铃薯属病毒和HIV可能有着相似的进化模式和平行的进化进程。RNA是马铃薯病毒属各物种的遗传物质,其编码了功能性的蛋白和结构蛋白等,并最终决定病毒的表型和致病性。RNA上碱基组成的微小差异可能就导致病毒朝着不同的方向进化。本章工作从分子水平上发现的微卫星序列多样性证明了马铃薯病毒属各物种在基因组水平上的遗传多样性。(第6章)