论文部分内容阅读
转录组是在特定的发育阶段或生理条件下,一个细胞中所有的转录片段的集合。转录组学的研究对于明确基因组的功能区域,揭示细胞和组织的分子成分,以及了解疾病发生发展等都是非常重要的手段。近年来,随着芯片技术与高通量测序技术的高速发展,转录组学研究产生了大量的基因表达谱数据,怎样从这些数据中读懂其蕴含的生物学意义,成为生物信息学与计算生物学领域研究的热点。通过整合常用的基因表达谱分析工具,优化高效的表达谱挖掘算法,基于Java相关的平台技术,我们开发出FOGA (Factory Of Gene Analysis)在线分析系统。目前,FOGA已经具有的基本功能包括:差异基因分析、基因与样本聚类、基因在染色体上可视化、基因重要性排序、基因调控网络构建等。FOGA对数据输入具有较高的灵活性,可接受高通量测序、基因芯片技术等产生的基因表达谱数据;能够根据用户定义的任务参数完成挖掘工作,并对分析结果进行友好的可视化输出。同时,FOGA拥有友好的用户操作界面,比传统的脚本分析流程更加高效便捷;采用模块化设计模式,为将来扩展新功能打下了良好基础。而且,首创以Joint l2,1-Norms Minimization理论为基础的新型算法,实现了基因重要性排序等功能,可以快速有效地筛选出疾病相关基因。使用一组DBA病人骨髓样品的基因表达谱数据对FOGA系统进行功能测试,发现了大量与DBA相关的致病基因。与通常采用的通过表达量、相互作用网络等复杂手段来获取关键基因的方法相比,FOGA分析系统更加智能和高效,为功能基因组学的研究开拓了新思路。