EST功能注释及数据挖掘平台的构建

来源 :中山大学 | 被引量 : 0次 | 上传用户:gaiwenru
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  考虑到本实验室和Genbank中已有的大量来自于海洋生物的EST,构建一个系统用于EST分析,对海洋生物功能基因组进行自动注释的系统具有重要意义。当前本地EST分析系统整合了大约40000条ESTs,这些EST分别来自于各个不同的海洋生物,如文昌鱼(Branchiotomabelcher),海马(Hittocampusqudableeker),水母(Cyaneacapillata),赤魟(Dasyatisakajei)。为了分析这些数据,首先,我们针对某一种生物或者是组织的EST进行了聚类,得到一致序列(consensussequences);然后,利用这些一致序列对蛋白数据库,功能域(domain)数据库进行相似性搜索,得到功能注释;更进一步的,我们还针对二级结构,三级结构进行了初步预测,同时还将EST中的基因映射到了已经研究清楚的Pathway中;另外,利用基因本体(geneontology)对文库中的序列进行标准的功能注释;最后,还利用了Intemet上的其它数据资源进行了深入的数据挖掘。   以上分析流程都使用类似于BIOPIPE的架构进行管理,而数据库则采用BIOSQL作为关系数据库模型的框架,BIOSQL实现了对象——关系数据库的存储模式,生物序列数据可以利用这一框架协同Bioperl-db模块进行方便的数据存储操作。用户可通过Web界面浏览分析结果,并进行如下操作:1、检索整个文库的注释信息;2、根据特定的索引号检索某一致序列的注释结果;3、使用NCBI-BLAST软件对文库中的序列进行相似性比对的查询。   经过分析,从大量的EST中将得到规模相对较小但更有价值深入研究的序列。我们还结合对Pathway映射和比较基因组研究的结果,对Pathway的演化进行了初步研究。同时我们还针对有价值的基因和注释展开了深入的分析,并拟结合实验的手段验证其功能。
其他文献
传统PID控制器具有结构简单、易实现以及稳定性好等优点,仍在工业控制领域广泛应用。然而在实际过程控制中,有许多过程机理复杂,难以确定精确的数学模型,并存在着不同程度的非线
本文通过对荣华二采区10
期刊
随着计算机技术的发展,人工智能领域成为研究的热点,具有广阔的发展前景。语音识别技术是人工智能的前沿技术之一,目的是使计算机能够听懂人类语言,实现人机语音通信,使计算
生物研究者通过访问数据库可获得大量的序列数据集和序列突变,这些数据的可视化使研究人员更加直观地研究这些变异在人类疾病中所具有的潜在作用。然而当蛋白质上的功能元件
随着计算机技术的快速发展,人与计算机之间的交流呈现多样化,人机交互也同样在不断的推出新的应用领域,其中基于视觉的手势识别由于手势的灵活多样性成为了研究的重点。手势识别
水稻细菌性条斑病是由Xanthomonas oryzae pv. oryzicola引起的,在热带、亚热带稻区广泛发生的细菌病害,也是目前威胁我国南方稻区水稻生产的重要病害之一,可以引起5%-40%的
太白山红桦林Betula albo-sinensis是秦岭中山带最主要的植被类型之一,但对植被属性认识尚有分歧。多数人认为桦林不稳定属次生林,将被云、冷杉林取代,但不少研究者将桦木林
本研究首先将克隆到的猪生长激素(pGH)基因cDNA编码区片段定向插入pGEX1-λT载体,转化大肠杆菌TOP10F’,用菌落PCR和质粒PCR方法筛选阳性克隆;以BamHI和EcoRI酶切鉴定重组质
东北地带性顶极植被阔叶红松林恢复问题是我国林学界普遍关注的问题。本文运用采伐试验与相对生长方程方法,研究了不同透光抚育方式(未透光-对照、轻度择伐-25%、中度择伐-50
在拉丁美洲,还没有旨在改变居民消费方式的正式政策.刚刚开展的一些举措通常都是关于教育和促进再循环利用,或者是针对经济危机的.市场政府、乡镇和非政府组织尽最大努力地接