不确定生物网络比对算法研究

来源 :东南大学 | 被引量 : 0次 | 上传用户:xlweb
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
不断发展的生物实验测定技术产生了越来越多的生物网络数据,比如蛋白质相互作用网络、基因转录调控网络等,这些数据中蕴含了大量的关于各种有机体之间相互影响和相互作用关系的信息。如何解释和分析此类生物网络数据,已经成为当前生物信息学领域的一个亟待解决的问题。其中,有一类重要的研究工作就是生物网络数据的比较,即生物网络比对。生物网络比对,简言之就是要寻找两个(或多个)生物网络顶点之间的一组映射关系,使得生物网络之间的相似性得分最高。  值得注意的是,由于一些原因,比如生物网络中相互作用模块的规模、密度、冗余度以及模块间的距离,甚至生物实验的误差,都会导致测量得到的数据不完全准确,使得其中含有许多不确定事件(概率事件),比如蛋白质相互作用网络中的边是以一定概率存在的,基因转录调控网络中的DNA也是以一定概率被转录成为RNA的。因此,在生物网络比对过程中,充分考虑和利用不确定信息,使用不确定图结构刻画原始网络,可以更准确地对现实情况进行建模,从而得到更准确的比对结果。然而,由于不确定图的概率特性,这些不确定信息在提高比对结果准确性的同时,也提高了算法的复杂度。目前绝大多数的生物网络比对算法都是针对确定生物网络比对问题而设计的,仅有极少数的算法可以处理不确定生物网络数据。因此,本论文针对不确定生物网络比对进行了研究,主要工作包括:  1、本文提出了一种改进的不确定生物网络比对算法PBNA(Probabilistic BiologicalNetwork Alignment)。在确定生物网络比对算法IsoRank的基本框架之上,PBNA将不确定生物网络信息纳入到顶点相似性矩阵构建过程中,允许参与比对的两个网络中有一个为不确定网络,之后应用邻居二分图(NBG)和贡献者(Contributor)改进了相似性矩阵计算公式,从而提高了顶点相似性计算的精度,并应用概率母函数降低了求解矩阵内每个元素期望的复杂度。实验验证了PBNA能够得到现有的确定生物网络比对算法得不到的比对结果,并以我们所知的现存唯一的不确定比对算法Prob为参考标准,验证了PBNA可以在更短的时间内得到更具生物意义的比对结果。  2、现有的Prob算法和PBNA算法仅能够利用到一个生物网络中的不确定信息,即只允许参与比对的两个网络其中一个是不确定网络。因此,本文进一步提出了“完全的不确定网络比对(Complete Probabilistic Alignment)”概念,并将现有的Prob算法与PBNA算法分别改进为完全不确定比对算法Prob CP与PBNA CP。两种改进的算法分别在原算法的基础之上,将之前被忽略掉的一个网络中的不确定信息纳入到顶点相似性矩阵构建过程中,并利用离散随机变量相关理论求其期望值,参与之后的运算。实验结果验证了两种扩展算法的有效性,并比较了二者的生物意义和时间效率,再次验证了加入Contributor等概念的PBNA_CP算法能够得到更具生物意义的比对结果,以及有着更高的时间效率。
其他文献
缩短嵌入式系统的开发周期,降低开发成本,并使之满足执行时间、功耗等性能上的约束是目前嵌入式系统开发面临的主要问题。软硬件协同设计思想的出现加快了嵌入式系统设计的开发
本文对基于Web Services的业务流程建模进行了研究。文章以WebServices为基础创建业务流程模型,将企业的业务进行整合,以实现企业资源的优化配置,从而适应复杂多变的商务环境。
SOC技术是一种高度集成化、固件化的系统集成技术。使用SOC技术设计系统的核心思想,就是要把整个应用电子系统全部集成在一个芯片中。随着现代嵌入式系统的迅速发展,仿真器以
网络和多媒体技术在教育领域的应用,带来了教育观念、教育模式、教学方法和教学手段等的深刻变革。Internet的分布式资源环境,在知识获取方式、共享能力及协作学习等方面为远
随着信息技术和网络技术的发展、各种应用服务的普及,为了提高用户的使用效率、方便管理员的管理,集成身份认证(Single Sign-On,SSO)和安全有效的授权管理需求越来越强烈。
语义依存是中文语义的深层分析,完善的语义表示体系对语义依存分析有重要作用。但是,目前公开且规范的中文语义依存标注语料还比较少。HIT语义依存是第一个被用来组织公开语义
由于自动导引车的高效性,精确性和灵活性,自动导引车在制造设施、仓库、配送中心和中转码头等地方得到广泛应用。自动导引车对可靠性要求非常高,形式化方法是保证高可靠性的
血管疾病已成为威胁当前发达国家公众健康的头号因素。近年来医学图像中的磁共振成像(MRI)能够有效地呈现出医学数据的几何形态等特征。如果能够采用MRI数据重建出三维脑血管
随着宽带网的发展和用户数量急剧增加,Web服务器成为访问的瓶颈。B/S模式中的Web服务器单点失效可能影响整个网络的可靠性。利用现有的Web缓存服务器和Web缓存服务器机群方案
随着网络的发展,许多应用中的数据不再是数据库中静态的数据,而是以一种流的方式在线到达的动态数据。这样的数据具有数据无界,数据量大,流速快,并且要求实时处理等特性,这种新型的