基于时序网络的蛋白质复合物挖掘与疾病基因预测研究

来源 :华中师范大学 | 被引量 : 0次 | 上传用户:jdsheny
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
生物网络模块化结构识别和人类疾病基因预测在生物信息学领域具有重要研究价值。本文从蛋白质相互作用网络的拓扑特征出发,认为网络中节点的模块归属性可以由它的周围邻居节点的紧密程度来界定。据此设计新的复合物识别算法,然后将该算法应用到人类蛋白质功能模块划分,通过对候选疾病基因进行排序预测疾病基因。具体而言,本文开展了以下研究工作:(1)蛋白质相互作用网络是一种复杂网络。受复杂社交网络形成规律和关键节点识别思想的启发,本文通过分析网络节点的邻居节点的关联紧密程度,提出一种新的在动态蛋白质网络上挖掘蛋白质复合物的新方法NC-TDPINs(Neighbor Closeness base on Transient Dynamic Protein Interaction Networks)。在NC-TDPINs算法中,首先以聚集系数较大的节点及其邻居作为初始模块核,然后采用基于邻居节点紧密度的划分策略来逐步进行核扩展,节点的归属性可以由分布在不同局部子图中的邻居节点的紧密程度来决定,从而实现蛋白质复合物识别。和其它经典算法相比,NC-TDPINs能够识别出更多具有生物意义的蛋白质复合物,同时准确性也优于其他方法。(2)复杂疾病的发生与发展通常涉及众多基因突变、表达调控紊乱等因素,这些基因相互之间表现出一定的模块性。本文根据"guilt-by-association"假设,从疾病表型与基因集合关系的角度出发,首先在蛋白质相互作用网络基础上构建模块相互作用网络,采用Mpagerank(Modules PageRank)方法先对模块进行打分,再对模块内的基因进行统计排序,通过考察模块中候选疾病基因与已知疾病基因的关系来预测疾病基因。实验结果表明:Mpagerank方法对疾病基因预测结果要优于NetScore,NetZcore,fFlow等经典方法。
其他文献
在信息化时代,获得信息的途径越来越多。互联网作为信息的载体,在传播效率和信息容量方面都有无可替代的地位。但是随着信息量的增加,用户在互联网上获得真正所需信息的变得越来
图像处理在现代医学中应用非常广泛,医学图像处理算法的研究具有重要的理论价值和实际意义,本文对于医学图像处理应用于口腔医学方面进行了研究。口腔根管根尖定位是本文研究的
无线传感器网络集成了传感技术、嵌入式计算、分布式信息处理和无线通信技术,能够协作地实时监测、感知和采集各种监测对象的信息,并进行处理。无线传感器网络路由协议的设计
随着网络技术的快速发展和广泛应用,特别是我国国民经济和社会信息化进程的全面加快,网络与信息系统的基础性、全局性作用日益增强,网络信息安全已经成为国家安全的重要组成
本文深入研究了当前化学信息管理系统和虚拟筛选系统的发展现状及其存在的问题,分析了现有的化学信息学软件技术及虚拟筛选工作流程,针对现如今新药研究周期长、效率低这一现
以信息化、数字化、网络化为特点的社会的发展对国家以及社会生活安全性提出了全新的要求,在这种环境下,传统的安全技术遭到了巨大的挑战。而生物特征认证技术是解决信息化、
IP网络技术和信息处理技术的迅猛发展使得视频会议系统得到了广泛的关注。视频会议系统作为一种新型的通信和交流工具,突破了地域的限制,可以提供更为便捷、灵活、全面的视音
P2P网络作为一种建立在应用层的新型覆盖网络,相比传统的C/S型网络,具有无中心化、自治以及匿名等特点。但是由于节点的行为不受约束,导致节点间缺乏信任,P2P网络也遭受着各
Ad hoc网络是指在没有固定基础设施的情况下,由具有无线通信功能的节点自组织形成的多跳的无线网络。它适用于需要临时架设网络的场所,具有广阔的发展前景。在Ad hoc网络中,
无线传感器网络(Wireless Sensor Networks,WSN)是集无线通信、嵌入式计算于一体的新兴的分布式自组织数据采集网络,通常布设在特定的区域完成一些特定的功能。在军事、环境