论文部分内容阅读
表达序列标签(Expressed sequence tags,ESTs)是一种快速有效揭示基因组容量的方法。为了全面了解鸡下丘脑组织和猪脂肪组织基因表达类型,构建鸡猪不同组织的功能基因表达谱,本研究利用cDNA文库,对鸡下丘脑组织和猪脂肪组织的EST序列进行了测定,为全面了解鸡下丘脑组织对鸡生长发育的影响和猪脂肪组织内脂肪蓄积的机理提供基因组学和分子生物学依据。 利用λgt10为载体,构建了鸡下丘脑cDNA文库。经滴度测定,所构建文库的滴度为3.8×106,重组率为80%。经酶切鉴定和PCR鉴定,文库的平均插入片段大小约为1.6kb。 以λ噬菌体DNA和PCR产物为模板两种方法,测定了83个克隆的EST序列。所获得EST的平均长度为418bp。其中以λ噬菌体DNA为模板测定了22个EST序列,其所测克隆的平均插入片段大小为1.6kb,所获EST平均长度为490bp(188-759bp),但反应的成功率较低(55%)。以PCR产物为模板虽然可以提高反应成功率(76.25%),然而由于大片段扩增的困难其平均插入片段大小较低(1.1kb),所测EST平均长度只有396bp。所测83个EST序列全部呈送Genbank,并取得了序列的Accession No.。利用非冗余核酸数据库对所获得的83个EST序列进行了同源性分析,并对无匹配序列进一步在EST数据库中进行了同源性比较。结果表明,在所测83个鸡下丘脑组织EST中,发现了38个已知功能基因(45.78%),线粒体基因为12(14.46%),在已知EST数据库中找到同源EST序列12个(14.46%),未知EST序列为21个(25.30%)。在同源性比较过程中,发现了3个多拷贝基因,在已知功能基因中,ubiquitin拷贝数最高;在已知EST中发现克隆CHHB8、CHHB12、CHHB17、CHHB24均与人类EST AJ396163dkfz426 cDNA clone 25h7r1同源;另外在本实验中还发现一种未知EST也呈现出高拷贝表达。利用已知功能基因构建了鸡下丘脑组织基因表达谱,脑组织特异表达基因在所测EST中也有出现,值得注意的是在垂体中表达的垂体糖蛋白激素alpha亚单位和前阿黑皮素在下丘脑EST中也有出现。本实验对已知EST和未知EST序列进行了蛋白质开放阅读框预测,并且与蛋白质数据库进行了同源性比较。结果表明,克隆CHH0014、CHH0022、CHH0028、CHHD21均获得了同源性较高的同源产物。克隆CHH0022、CHH0028和CHHD21有多个蛋白与之同源可能预示着多阅读框mRNA或神经肽类型。 利用大规模DNA序列测定方法,对猪脂肪组织进行了EST序列测定和分析。猪脂肪组织大规模EST序列测定共进行了10860个单向单次测序反应,所处理的总碱基数达到了8,730,421个碱基,成功反应数为9297(85.61%),其中>100bp的高质量reads数量为7790,占反应总数的71.73%,总碱基数为3,118,636,平均有效读长为400bp。利用NCBI的Genbank和EMBL的ESTdatabase等公共数据库,对6494条大于100bp的高质量reads(去除污染序列)进行了比较分析。结果表明,在所分析的6494条EST序列中,已知功能基因为4461(68.67%),已知EST序列为1000(15.40%),未知功能基因为1033(15.91%)。利用AccessionNo.为索引,构建了猪脂肪组织已知功能基因的功能基因表达谱。从各类功能基因数目来看,细胞结构/迁移、细胞/ 中国人民解放军军需大学 中文摘要一机体防御、基因/蛋白表达和代谢等的基因数目明显少于所测定克隆数。而未知功能基因大部分为单拷贝基因。己知功能基因中参与脂肪代谢克隆数目为 33个,共有84个(23.33%)参与脂肪代谢,这84个基因可以作为决定脂肪代谢特性的候选基因。通过利用基因名称为索引进行聚类后发现,所测 446个己知功能 EST中,可以聚类成2311个聚类群体,其中最大的一个为MHC Class SLA基因。 利用tblastx对所测EST中的1000条己知EST序列和1033条未知EST序列的蛋白阅读框进行了预测,并利用tblastx将所翻译成的蛋白质的氨基酸序列与蛋白质数据库进行了比较分析,分别产生了146条和38条期望值<-5的序列。其中值得注意的是己知EST中克隆rPfatll802、rPfat15532、rPig.3138三个EST的蛋白阅读框与蛋白质数据库比较后,均得到了同源性非常高的同源产物。 利用phrap,对6494个高质量reads进行了聚类分析,结果表明,大部分连续重叠群(。。ntig)中均有两种或两种以上的EST,在将条件严格到min。atch/minscore=50/120时,contig结果没有明显改善,说明在基因组组装中广泛应用的phrap/conced并不适合本实验EST分析。利用Accession NO.并结合关键词和利用CAT聚类方法相结合的方法对所测EST序列进行了组装分析。结果表明,4461个己知功能基因可以形成1723个singlets和588个Cluster,而2033条已知和未知EST可以形成164个Cluster和1512个singlets,说明本实验所测的猪脂肪组织EST中共包含了3987个表达基因(不包括线粒体基因)。 通过对所测4461个己知功能基因和1000个已知EST序列与STS数据库进行Blast分析结果表明,己知功能基因和己知EST中分?