论文部分内容阅读
随着人类基因组计划的开展,大量物种的基因被测序,生物数据资源呈爆炸式增长,现已有大量的胡颓子科基因被测序,丰富的数据资源为挖掘基因序列背后所隐藏的生物信息创造了条件。基于网络资源平台,从GenBank核苷酸数据库中共获取了50条胡颓子科nrDNAITS序列(包括33条沙棘属,5条胡颓子属,12条大果沙枣)对其进行了生物信息学分析。主要结果如下:1.胡颓子科(Elaeagnaceae)nrDNAITS序列生物信息学分析胡颓子科ITS序列中5.8S长度保守,ITS2次之,ITS1变化范围最大。5.8S片段碱基突变位点转换多于颠换,其中第34和160位碱基在西藏沙棘为胞嘧啶(C)和鸟嘌呤(G),异于其它沙棘种;130和133位在沙棘属中为腺嘌呤(A)和胞嘧啶(C),不同于胡颓子属;58位和121位点碱基的突变在沙棘属的无皮组中不同于有皮组,这些突变位点可以作为区别种间和属间的信息位点。沙棘属植物中有皮组5.8S片段的平均GC含量(56.1%)略高于无皮组(54.8%),西藏沙棘的平均GC含量高于其它沙棘种,发现随着海拔的升高物种GC含量有增加的趋势。沙棘属5.8SRNA二级结构相似,也存在较大的种间差异。总体有I、II两种构象。胡颓子属5.8SRNA二级结构为构象I。大部分沙棘属5.8SRNA二级结构为构象II,又依据多分支环和发卡环的差异,分为构象IIA、IIB、IIC。西藏沙棘(IIC)二级结构明显区别于其它沙棘种,体现西藏沙棘是独立进化的一支,是最先分化出来的种,支持西藏沙棘发生了谱系分化。初步推测5.8S二级结构“变形”巨大的序列是假基因,再通过分析5.8S序列的GC含量、手工检测甲基化位点、5.8Smotifs查询、以及对二级结构稳定性的分析等,认为ψFN687766、ψAF440247、ψAF440251、ψFN687767、ψFN687767、ψFN687769、ψAF440258为ITS假基因序列。沙棘属植物均为二倍体(2n=24),但沙棘种的随体(NOR)的数目、位置报道并不相同。可能随着杂交的产生和染色体联会重组,使ITS致同进化缓慢而逐渐形成了ITS假基因。5.8S一级序列系统发育分析时,假基因产生异常的支长,与同种的个体序列聚类在一起,没有单独成支,说明其起源时间短。系统树基本将有皮组和无皮组分开,并支持沙棘属的单系起源。5.8SRNA二级结构构建系统发育树时,假基因处于系统树的基部,与功能序列分开,不影响系统树的结构,二级结构可以作为沙棘属分子系统学的一种新的信息来源。2.大果沙枣(E.moorcroftii)nrDNAITS序列的生物信息学分析大果沙枣ITS1、5.8S、ITS2片段碱基突变位点转换高于颠换,GC含量高于AT含量。其中,ITS2信息位点最为丰富,5.8S最保守。大果沙枣ITS1是由3条双螺旋结构(茎)组成的多分支环。ITS2是4条茎组成的多分支环。通过分析5.8S一级、二级结构认为ψEF423354为ITS假基因。构建的系统发育树中,相同地区的大果沙枣并没有完全聚类在一起,甘肃地区和新疆地区的大果沙枣基本聚类在一起,这可能与人为引种频繁有关。