蛋白网络聚类研究及其可视化软件开发

来源 :广西师范大学 | 被引量 : 0次 | 上传用户:lieying110
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当今,用蛋白相互作用网络研究蛋白功能已经成为科学界的一个热点。科学家通过对蛋白相互作用网络的研究发现相互作用的蛋白质趋向于具有相似的细胞功能。聚类方法能根据蛋白相互作用与蛋白功能一致性的特点,利用网络中蛋白质之间的亲疏关系,发掘出网络本身内在的“抱团儿”性质,使得复杂网络中的蛋白能够“分散地聚集”,即形成一个个规模小得多的团,同时也使得原来错综复杂的网络信息能分散地集中在各个团中,然后,对聚成的团分别进行单独的分析。因而,聚类方法能基于近邻相互作用研究蛋白功能模块并预测蛋白功能,自然成为蛋白网络研究的一种很好的选择。本文主要着眼于满足蛋白网络模块化特点的聚类方法的拓展和蛋白网络可视化软件的设计开发。本文对网络中的聚类算法进行了研究,提出了一种能满足蛋白相互作用网络“块内紧密,块间稀疏”的模块化特点且简单易行的新的基于蛋白功能团的拓扑层次聚类方法――MCM算法。该算法打破了传统的基于蛋白间相似度的聚类模式,直接从蛋白功能团的角度出发,考虑功能团间的一阶和二阶相互作用,定义新的相似度,对最新的高通量的酵母蛋白网络实验数据进行聚类分析,并预测模块内未知蛋白的功能。通过超几何分布P值法和增、删、改相互作用的方法对聚类结果进行预测能力分析和稳定性分析。结果表明模块化聚类方法具有较高的预测准确度和覆盖率,有很好的容错性和稳定性。MCM聚类分析还得到了一些具有高预测准确度的未知蛋白的预测结果,将会对生物实验有指导意义,其算法对其它的具有相似结构的网络也具有普遍意义。此外,在Jbuilder软件环境上开发实现了PINC蛋白网络显示软件。该软件基于ADJW可视化方法的算法思想,采用矩阵显示和传统显示相结合的方式可视化蛋白相互作用网络。在PINC设计开发过程中,采用“模型-视图-控制器(MVC)”的设计模式,开发网络矩阵显示和聚类树显示相结合的多视窗界面。PINC集成了蛋白网络常用的聚类算法ADJ,ADJW,RIVES,BRUN,RAVASZ和SAMANTA,还有我们的MCM算法,结合传统显示和功能注释等方式具体细致地研究了蛋白网络的功能信息和其它相关生物学信息,能为生物学家提供一个跨系统的蛋白网络分析平台。PINC将聚类方法研究与可视化软件结合起来,能克服传统可视化软件的容易隐蔽大规模网络数据的信息的缺陷,是传统可视化软件的很好的补充,必将促进网络研究的发展。
其他文献
随着计算机网络的全球化,网络应用不断发展,随之引发的网络安全问题越来越为企业和政府所重视。传统的网络安全技术侧重于网络的入侵检测或防病毒软件,这类安全措施通常不能减少
质量保证已经成为软件行业越来越重要的一个指标。不管项目采用的是什么软件开发模型或流程,软件质量都是软件开发项目能否成功的一个关键的因素。敏捷开发是一种相对来说较新
RSA是一种公钥密码算法,其加密密钥和算法本身都可以公开,解密密钥则归用户私人拥有。从诞生那天起,RSA就因为安全强度高、使用方便等卓越性能受到关注,并得到广泛应用。目前
排课问题是一个涉及多因素约束的、多目标的、结构复杂的典型组合优化问题,并且已被证明为一个NP完全类,其问题求解的时间复杂度呈指数函数增长。分布式环境下的排课所面临的突
随着诊断技术的激烈竞争和计算机技术的迅猛发展,设备的状态检测与故障诊断已成为现代工业生产、航空航天和国防建设中的重要内容,也是科学界研究的热点之一。本文在分析各种神
随着WiFi与ZigBee技术的不断发展以及他们在日常生活中发挥着越来越重要的作用,如高速网络接入和火灾监控等,这两种异构网络得到了越来越广泛的部署。由于WiFi和ZigBee共享2.
无线Adhoc网络是一种具有高度动态拓扑结构的网络。每一个无线Adhoc网络由一组移动节点组成,它们与传统的蜂窝技术的根本区别在于移动节点之间的通信是在没有固定基础设施支持
汉语言认知是认知神经科学领域中的重要分支。目前,针对多音字的研究还比较少,其认知机制还尚不清楚。因此,本研究的主要工作是采用具有高时间分辨率的事件相关电位(Event-Re
本系统是在对我校招生管理流程进行完整而深入分析的基础上,结合学校实际业务以及校园网络应用环境的需求,进而提出基于.NET框架的一种C/S和B/S模式相结合的设计与实现综合方案
数据挖掘领域里,分类问题一直以来都是的一个重要研究分支。在当前多数据源数据日益普及的情况下,对数据挖掘领域中分类问题的研究也提出了新的挑战,例如如何从多个数据源中