PPI网络中的蛋白质复合物挖掘算法研究

来源 :陕西师范大学 | 被引量 : 0次 | 上传用户:zmhao
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在蛋白质相互作用(protein-protein interaction,PPI)网络中挖掘复合物是蛋白质组学的研究重点。通过研究复合物和功能模块能帮助人们深入地了解生物体的生命特征、分析疾病机理等。然而,由于现在可用数据众多、维数较高、假阳性率和假阴性率很高、结点间相互关系不稳定等多种因素,导致直接使用实验数据精确性不高,而且仅从结点的某一特性去判断它们之间的关系比较单一,不同的特性在很大程度上影响着最终预测结果。本文旨在研究PPI网络中预测复合物的方法,主要工作如下:(1)将布谷鸟搜寻机理用于复合物识别。为避免根据结点的单一特性挖掘复合物,本文同时考虑了结点的拓扑特性、生物特性以及结点和复合物之间的关系,用不同的相似性度量标准判断结点间的关系并进行两次聚类。第一阶段根据布谷鸟更愿意寻找相似度较高的鸟巢孵卵,成活几率大且不易被宿主发现这一生物特点,计算小鸟与鸟巢的相似性,多次迭代使得小鸟找到理想鸟巢,从而得到初始簇,再利用亲和密度将未找到鸟巢的小鸟聚类;第二阶段是对复合物结点个数较少和尚未聚类的结点进行二次聚类,根据顶点和邻居构成的簇密度大于限定值进行合并,然后根据亲和度进行扩展,将稀疏结点尽可能的聚到各个类簇中,从而获得更多复合物,这种方法运用不同的度量标准考虑更全面,所得聚类比较有效。(2)利用粒度计算的思想挖掘复合物。粒度计算和聚类有天然的共性,本文根据这一共性引入商空间理论,该理论首先采用子集或者商空间表示问题,不同商空间表现成不同粒度的商集,然后用等价关系粒化得到各个划分,选择合适粒度空间,将多个不同粒度空间继续合成,最终得到初始问题的解。本文结合了 GO基因本体数据和PPI数据来判断粒子之间的关系,弥补了单纯使用PPI数据的不足,运用商空间理论对网络中样本数据进行处理,通过对网络进行粒化从而构造商空间,然后将其逐层合并,每次对于还未聚类的粒子,仍保留到类簇中,以此增加粒子的多样性,最后将合并结果提纯后即为聚类结果。实验表明,这种新的方法能更加高效地预测复合物。(3)基于拓扑势加权的动态PPI网络复合物挖掘方法。由于PPI数据的假阳性率和假阴性率很高,不能准确地描述真实网络,本文结合拓扑势场的思想对该网络进行优化。拓扑势场描述的是每一个粒子和周围粒子之间的作用关系,而PPI网络中结点之间也存在相互作用,二者具有相似的特性,所以使用结点之间的拓扑势给网络加权能更好的反映实质的生物网络结构,并且结合基因表达数据构建时序动态子网,然后利用MCL聚类算法在PPI数据上挖掘蛋白质复合物。与其它经典方法相比,该方法能更准确地挖掘复合物。
其他文献
为了应对移动用户设备爆发式增长带来的数据传输需求,当前移动通信网络正不断向下一代通信网络进行演进。由于密集异构网络可让有限的频谱资源高度重用,被认为是下一代网络提
共价有机框架(Covalent Organic Frameworks,COFs)是一类新型的晶态有机多孔材料。由于具有密度低、比表面积大、结构可控、易于功能化等优点,COFs在气体吸附/分离、光电、催
近年来,软件系统的稳定性问题和安全性问题日益突出。本文基于软件网络中节点之间的调用关系结合软件网络中的特性,从复杂网络理论的角度出发,分析软件系统中节点和社团等网
为了保证软件的安全性,软件漏洞检测研究一直以来均受到着广泛的关注。模糊测试技术是一种有效的检测软件漏洞的方法,软件漏洞语料库是帮助研究人员改进和完善模糊测试技术的重要基础。然而,由于软件漏洞语料库的缺乏,模糊检测技术的发展受到了很大的阻碍。为了解决这个瓶颈问题,本文基于安全博弈论的相关理论提出了一种高效的软件漏洞生成策略。通过这种软件漏洞生成策略,可以高效地生成大量软件漏洞语料库。本文的主要思想是
随着智能终端、多媒体技术的迅猛发展,宏蜂窝网络中的用户数目不断增加。然而宏小区(Macrocell)的覆盖范围较广,并不能很好地保证覆盖范围内的宏用户都具有较好的通信性能。
各国日趋严格的汽车尾气排放标准催生了市场对车用NOx传感器的需求。基于固体电解质的电化学类型NOx传感器易于与EFI系统中的各部件相配合,能够进行现场检测,有效地减少尾气
磷光铜(I)配合物因发光量子产率高,价廉易得,对环境友好,正成为有机发光二极管(OLED)发光材料的热门“候选人”之一。近年来,一些具有热激活延迟荧光(TADF)效应的铜(I)配合物得以设计
随着科学技术的快速发展,机器人技术在日常生活领域的应用日益增多,极大方便了人类的生活。本文基于辅助上肢残疾人士的日常生活的理念,将机器人技术应用于人体上假肢领域,以经济化、轻量化和高性能为目标,对机器人假肢进行了分析与研究。基于仿生学理念,根据上肢的使用功能特征,对机器人假肢的柔性佩戴结构、肩关节、肘关节、腕关节和手部结构进行设计,对机器人假肢驱动方案进行了选择,对电机进行了计算选型;针对目前市面
链路自适应技术可以提高数据传输速率、吞吐量和频谱效率,被长期演进(Long Term Evolution,LTE)上行链路采用为关键技术,而反馈信息的实时性和干扰状态会对自适应技术的性能
随着光接入网用户数量和多媒体业务的急剧增长,时分复用无源光网络(Time Division Multiplexed Passive Optical Network,TDM-PON)因其带宽容量受到限制越来越难以满足用户对