论文部分内容阅读
动物基因组学的发展产生了一大批有价值的数据,EST是其中的重要组成部分。利用生物信息学的原理和方法发掘这些海量数据中蕴藏的信息,已成为当前基因组学研究的一个重要组成部分。
为了从表达序列标签中筛选微卫星标记,本研究利用生物信息学的方法,使用SSRIT(在线)和SSRFinder(未公开的)软件分别对绵羊和牛UniGene数据库的4081个和41986个簇进行了微卫星序列的筛选。标准是:二碱基重复基元最少重复7次以上;三碱基重复基元最少重复6次以上;四碱基重复基元最少重复5次以上;五碱基重复基元最少重复4次以上;六碱基重复基元最少重复3次以上。单碱基重复基无没有选择,因为一般它们不被认为是有用的多态标记。所搜索的微卫星序列均为完全形式的重复序列。结果表明:绵羊搜索到微卫星136个,分布于121个序列中,出现的频率为3.0%,平均间隔距离为每22.47kb出现1个SSR;牛搜索到微卫星1831个,分布于1666个序列中,出现的频率为4.0%,平均间隔距离为每19.89kb出现1个SSR。在牛微卫星序列中,双核苷酸重复类型占的比例最大,为54%;三核苷酸重复类型位居其二,为22%;四核苷酸重复类型占的比例最小,为13%。而在绵羊的微卫星序列中,三核苷酸重复类型占的比例最大,为40%;双核苷酸重复序列位居其二,为34%;四核苷酸重复类型占的比例最小,为2%。
在牛和绵羊的二核苷酸重复类型中,AC/TG是最丰富的类型,TA/AT位居第二,而GC/CG是最少的类型。在三核苷酸重复类型中,在牛上,AGC是最丰富的类型;CGG位居第二;CTG位居第三。在绵羊上,CTG是最丰富的类型,CGG位居第二,AGG位居第三。
对筛选出的牛和绵羊的EST-SSRs序列,在GenBank数据库进行BLASTX比对分析,用E值(1e-5)这个参数来推测功能。结果对1666条牛EST-SSRs序列进行BLAST比对,共有698条序列在蛋白质水平上具有同源的产物;对121条绵羊EST-SSR序列进行BLSAT比对,结果共有45条EST序列在蛋白质水平上具有同源的产物。
在筛选的绵羊微卫星序列中,用PrimerPremier(版本为5.00)软件设计并合成了54个引物对。在31对扩增出产物的引物中,经过PCR扩增,聚丙烯酰胺凝胶电泳和硝酸银染色,最终共筛选出3个引物对呈现多态。在绵羊200多个样本的3个微卫星位点上,等位基因的数目分别为5、11、17,等位基因的大小分布在170-301之间,基本符合引物设计时的理论产物长度。这些微卫星位点的期望杂合度的范围从0.771-0.841,表明他们有较高的杂合度。3个微卫星位点的PIC值从0.731-0.821,指出这些微卫星位点在绵羊中均具有较高的信息含量,适合进行各种遗传学分析。
为了从表达序列标签中筛选微卫星标记,本研究利用生物信息学的方法,使用SSRIT(在线)和SSRFinder(未公开的)软件分别对绵羊和牛UniGene数据库的4081个和41986个簇进行了微卫星序列的筛选。标准是:二碱基重复基元最少重复7次以上;三碱基重复基元最少重复6次以上;四碱基重复基元最少重复5次以上;五碱基重复基元最少重复4次以上;六碱基重复基元最少重复3次以上。单碱基重复基无没有选择,因为一般它们不被认为是有用的多态标记。所搜索的微卫星序列均为完全形式的重复序列。结果表明:绵羊搜索到微卫星136个,分布于121个序列中,出现的频率为3.0%,平均间隔距离为每22.47kb出现1个SSR;牛搜索到微卫星1831个,分布于1666个序列中,出现的频率为4.0%,平均间隔距离为每19.89kb出现1个SSR。在牛微卫星序列中,双核苷酸重复类型占的比例最大,为54%;三核苷酸重复类型位居其二,为22%;四核苷酸重复类型占的比例最小,为13%。而在绵羊的微卫星序列中,三核苷酸重复类型占的比例最大,为40%;双核苷酸重复序列位居其二,为34%;四核苷酸重复类型占的比例最小,为2%。
在牛和绵羊的二核苷酸重复类型中,AC/TG是最丰富的类型,TA/AT位居第二,而GC/CG是最少的类型。在三核苷酸重复类型中,在牛上,AGC是最丰富的类型;CGG位居第二;CTG位居第三。在绵羊上,CTG是最丰富的类型,CGG位居第二,AGG位居第三。
对筛选出的牛和绵羊的EST-SSRs序列,在GenBank数据库进行BLASTX比对分析,用E值(1e-5)这个参数来推测功能。结果对1666条牛EST-SSRs序列进行BLAST比对,共有698条序列在蛋白质水平上具有同源的产物;对121条绵羊EST-SSR序列进行BLSAT比对,结果共有45条EST序列在蛋白质水平上具有同源的产物。
在筛选的绵羊微卫星序列中,用PrimerPremier(版本为5.00)软件设计并合成了54个引物对。在31对扩增出产物的引物中,经过PCR扩增,聚丙烯酰胺凝胶电泳和硝酸银染色,最终共筛选出3个引物对呈现多态。在绵羊200多个样本的3个微卫星位点上,等位基因的数目分别为5、11、17,等位基因的大小分布在170-301之间,基本符合引物设计时的理论产物长度。这些微卫星位点的期望杂合度的范围从0.771-0.841,表明他们有较高的杂合度。3个微卫星位点的PIC值从0.731-0.821,指出这些微卫星位点在绵羊中均具有较高的信息含量,适合进行各种遗传学分析。