论文部分内容阅读
减数分裂是有性生殖的关键环节。蛋白质—蛋白质相互作用(protein-proteininteractions,PPIs)在减数分裂过程中起着重要作用。多年的研究已经产生了大量的减数分裂蛋白互作数据,如何将这些数据整合起来进而解决数据分散、系统性差的问题变得尤为迫切。本文利用脚本程序结合人工校正的方法,设计并优化了减数分裂基因和蛋白互作数据的收集和整合流程,充分挖掘了文献和数据库中的相关蛋白互作信息,构建了不同物种的蛋白互作网络,最终实现了这些数据在减数分裂数据库中的可视化显示。主要结果如下: ⑴减数分裂基因的收集。我们首先确定了20个在减数分裂相关文献和数据库中频繁出现的字词,通过编写程序在PubMed数据库中搜索到含有这些字词的减数分裂研究相关文献约22万余篇;在进一步整理和归类的基础上,筛选出核心文献约1.7万篇;然后,我们基于文献挖掘和数据库搜索,最终获得拟南芥(Arabidopsis thaliana)、酿酒酵母(Saccharomyces cerevisiae)和秀丽隐杆线虫(Caenorhabditis elegans)三个物种的减数分裂基因共429个(三个物种中分别为89个、162个和178个),并获取了各基因相应的基本信息。 ⑵减数分裂蛋白互作数据的挖掘。我们在283篇文献和13个数据库中收集了上述减数分裂基因的蛋白互作数据;通过进一步过滤和去冗余,最终筛选出减数分裂蛋白互作数据16,432条,其中生物信息学预测数据5,222条(占31.78%),实验验证数据11,210条(占68.22%)。 ⑶减数分裂蛋白互作数据的整合。在考虑了蛋白表达的时空性的前提下,我们分析了蛋白互作数据,并将其整合成网络;根据减数分裂的细胞学过程,整理并绘制了拟南芥、酵母和线虫在减数分裂启动和配对、联会、同源染色体重组以及同源染色体分离等不同时期的蛋白互作网络图。 ⑷减数分裂蛋白互作数据的可视化显示。通过编写程序,将减数分裂基因信息和蛋白互作数据存储在我们构建的网络版“减数分裂数据库”中;并将蛋白互作网络图在数据库中进行可视化显示。 ⑸设计出了一套减数分裂基因和蛋白互作数据收集和整合的流程,获得了拟南芥、酵母和线虫中的相应数据,对大量减数分裂蛋白互作数据进行了梳理和整合,初步构建了减数分裂不同时期的蛋白互作网络,在“减数分裂数据库”中实现了蛋白互作数据的批量录入和可视化显示。本研究不仅为减数分裂研究提供便捷可靠的数据支持,而且能够提高人们对减数分裂过程的共性和特性的认识。