基于最佳邻居节点的蛋白质复合体挖掘算法研究

来源 :华中师范大学 | 被引量 : 0次 | 上传用户:netdownloadfile
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在后基因组时代,系统地分析和理解生物体内蛋白质问如何通过交互来完成生命活动是—个重要的挑战。分析蛋白质网络的结构特性,从蛋白质网络中挖掘蛋白质复合体和功能模块以及标注未知蛋白质功能正成为当前蛋白质组学研究的重点。本文在深入分析蛋白质网络的结构特征的基础上,根据蛋白质网络的共有特性提出了有效识别蛋白质复合体的算法,主要研究工作包括:(1)在大多数现有算法中,模块的最佳邻居节点往往被定义为跟模块内所有节点关系最紧密的节点。文中重新定义了节点和模块的最佳邻居节点,以节点间的共同邻居数来作为衡量最佳邻居节点的重要因素,将满足特定条件节点的最佳邻居节点来作为模块的最佳邻居节点。(2)提出了一种混合模块化度量标准LGQ (Local-Global Quality of modularity),既克服了全局模块化度量标准Q (global Quality of modularity)不能有效识别规模较小模块的局限性,又考虑到被局部模块化度量标准LQ (Local Quality of modularity)所忽略的模块在整个网络中所具有的全局特性。接着,提出了一种基于LGQ的最佳邻居节点挖掘算法BN-LGQ (Best Neighbour with LGQ),该算法不需要其他辅助信息,简单有效。将BN-LGQ算法应用于酵母蛋白质网络,实验结果表明,该算法能够有效识别较多的已知蛋白质复合体以及较多的具有生物意义的蛋白质复合体。(3)通过对复杂社会网络社区形成规律的研究,提出了一种基于多阶段核扩展的最佳邻居节点挖掘算法BN-MNE (Best Neighbour-Multistage Nuclear Extension)。首先,将算法BN-MNE应用于典型的复杂社会网络社团结构识别,实验分析表明,该算法能够较其他算法更好地识别复杂网络的社团结构。然后,将算法BN-MNE应用于酵母蛋白质网络,实验结果表明,该算法能够较好地挖掘出具有生物意义的蛋白质复合体,与复杂社会网络的实验结果有很好的一致性,同时也能够为其它基于复杂网络结构的蛋白质网络中复合体的识别提供有价值的参考信息。
其他文献
随着计算机、通信和网络技术的飞速发展,军队办公自动化、电子化、网络化建设正加速推进,电子军务作为军队信息化建设的基础和发展方向倍受关注。工作流系统作为一种新型、高效
分类被广泛的应用于生产、科学研究、日常生活等领域的方方面面。随着机器学习应用范围的扩大,信息技术以及互联网的迅速发展,每天都有大量的数据被收集,新的挑战和问题也随
考虑到实际问题中,属性值间可能会有偏好关系,传统粗糙集理论不能很好的解决这种问题,因此用优势关系代替传统粗糙集中的等价关系,提出基于优势关系的粗糙集理论。基于优势关系粗
近年来,多媒体视频业务得到了广泛应用,但由于视频流庞大的数据量以及Internet网络“尽力而为”的服务特性,使得视频实时传输服务质量已无法满足用户的需求。为了在视频应用
随着信息技术的发展,不同组织域间的合作需求越来越大。但实际中不同自治域的组织结构多不相同,如网络服务,P2P和网格应用,同时各个系统作为一个独立的域,都有自身的访问控制策略,
随着移动互联网的飞速发展和社交媒体的兴起,网络上的图像数量正呈现爆炸式的增长,图像检索技术已经成为计算机视觉领域的热点研究方向,同时针对移动终端上的图像检索也在学术上
为了提高数据中心所有物理服务器的资源利用率和能源使用率,可以通过动态整合虚拟机的方式来实现。虚拟机动态整合的主要实现方式有物理服务器之间虚拟机的实时迁移和动态地
人体行为识别是计算机视觉的研究难点与热点,在智能视频监控和运动分析等领域有着广泛的应用前景。但目前大部分研究者主要针对视频中的行为展开研究。然而,人类的视觉往往根据
我国的蒙古文信息技术标准体系正在构建之中,由于缺少对蒙古文信息处理产品标准符合性检测的工具,难以强化已有蒙古文信息技术标准的实施力度。针对这种情况,本文对蒙古文信
随着信息化、数字化技术的发展,作为信息中枢的图书馆越来越多的承担起信息网络中心节点的重任。信息发布网站、网络化图书流通管理系统、电子资源的网络平台等各个系统的使用