【摘 要】
:
高通量技术的发展促进了大量蛋白质相互作用网络数据的产生,蛋白质相互作用网络决定了大部分细胞功能,对蛋白质相互作用网络进行研究有助于从系统角度理解各种生物学过程和生命活动规律,其中一项很重要且广泛的研究工作就是对蛋白质相互作用网络进行比对分析,通过网络比对可找到网络保守功能模块,对蛋白质功能进行研究,发现生物进化关系等。网络比对是一个NP-hard问题,蛋白质相互作用网络全局比对以最大化比对结果相似
论文部分内容阅读
高通量技术的发展促进了大量蛋白质相互作用网络数据的产生,蛋白质相互作用网络决定了大部分细胞功能,对蛋白质相互作用网络进行研究有助于从系统角度理解各种生物学过程和生命活动规律,其中一项很重要且广泛的研究工作就是对蛋白质相互作用网络进行比对分析,通过网络比对可找到网络保守功能模块,对蛋白质功能进行研究,发现生物进化关系等。网络比对是一个NP-hard问题,蛋白质相互作用网络全局比对以最大化比对结果相似性的方式寻找蛋白质同源关系,难点在于如何将相似蛋白质进行匹配。研究表明蛋白质的序列相似性可用于判定蛋白质的同源关系,因此将其加入相似性计算过程有助于得到更多同源蛋白质,但是序列信息具有不完整性,因此,本文通过拓扑和序列结合的方式计算节点间的相似性指导比对结果的生成,具体工作内容如下:1、为寻找网络比对问题的近似最优解,整合基于离散化蝙蝠算法的网络比对算法Bat Align,分别在合成网络和真实网络中进行实验,与四种效果较好的算法进行对比实验,分别通过拓扑指标和生物指标衡量比对结果质量,并就比对结果中蛋白质功能进一步分析比对结果的生物学意义。实验结果表明,Bat Align算法能够得到生物质量高的比对结果,能够识别网络中的同源蛋白质。2、为提高比对结果拓扑和生物质量一致性,提出融合局部拓扑结构和序列信息的群体优化网络比对算法PONAL,在Bat Align算法的基础上进行几点改进。第一点,针对Bat Align过于依赖序列相似性问题,改进相似性计算方法,提高比对结果的拓扑质量;第二点,为丰富种群多样性并提高初始种群质量,更改初始种群的生成方法,保证每个节点的比对关系都是在相似性指导下得到的;第三点,使用保守边和保守节点相结合的目标函数,增加保守边数量的同时考虑保守节点的生物特性,提高比对结果的质量;第四点,为提高新个体的质量,使用全局搜索加局部随机搜索的方法。实验结果表明,PONAL算法能够识别网络中具有保守结构的子图,同时保证拓扑和生物质量一致性。3、为进一步提高比对质量,优化PONAL算法比对效率,提出基于集聚系数和序列信息的网络比对算法CCSNA。CCSNA算法分两步完成,第一步计算节点相似性,第二步使用搜索算法生成比对结果。在第一步中,首先,结合节点集聚系数和节点度计算节点重要性,然后结合节点重要性和节点序列信息计算节点初始相似性;在第二步中,计算了节点的相互作用得分,在初始相似性中加入相互作用得分得到比对相似性,贪心的选择比对相似性中得分最高的一对节点作为种子节点对并进行扩展,并增加其余邻居节点的比对相似性,增加邻居节点的比对概率,此种方法能够提高拓扑质量,根据更新后的比对相似性继续选择种子节点对并扩展,直到源网络所有节点完成比对。实验结果表明,CCSNA算法表现最佳,能够取得拓扑和生物质量高的比对结果。
其他文献
随着大数据时代的到来,单视图数据已经不能满足人们的需要,多视图数据应运而生。多视图数据指从多个角度或者以不同的衡量标准对同一事物进行全面描述的数据,它由多个视图组成,每个视图代表一个角度或者衡量标准。与单视图相比,多视图数据包含了更丰富的语义与更有意义的信息,因此对多视图数据进行研究是很有必要的。聚类作为无监督学习中的一项基本方法,在挖掘数据的底层信息方面表现卓绝,这正是研究多视图数据所需要的方法
受自然灾害和病虫害入侵等影响,林木内部容易出现腐朽和空洞。近年来探地雷达检测技术在树干无损检测领域兴起,其具有抗干扰能力强、检测速度快等优势,得到了研究者们的广泛关注。传统的探地雷达成像方法假设树干为圆形结构,获取半径宽时窗,用极坐标方式重建树干截面,容易导致缺陷定位偏差,检测准确度有限。本文结合信号处理、偏移算法和深度学习等研究了两种树干内部缺陷定位的成像方法,并且提出了针对活立木的多元协同检测
天波超视距雷达(Over-the-Horizon Radar,OTHR)通过高频天波在电离层的折射弯曲摆脱了地球曲率对视距的限制,其自上而下的探测模式,可以实现对隐身战机、低空飞行器等的早期预警和连续观测。目前,天波超视距雷达主要是通过多基地联合布站的方式实现对目标的高精度定位,同时该方式也提高了系统的生存能力,这对预防和打击外来侵略目标具有重要的意义。但多基地联合布站的定位方式也导致其定位模型在
多目标跟踪是数字图像处理和视觉领域的关键问题,包含检测识别和数据关联等多项任务,在社会生活、工业生产和军事等领域有广阔的应用前景。随着检测算法的发展,基于检测的多目标跟踪算法逐渐流行并由此产生不同的跟踪范式。其中一段式,即联合检测与嵌入的多目标跟踪范式,通过网络共享的方式将外观特征提取过程嵌入检测器中,较好的均衡了跟踪精度与跟踪效率。但该范式存在检测依赖和跟踪鲁棒性较差等问题,在线跟踪的实时性也难
随着世界人口不断增长以及城市化进程发展,人员过分聚集导致的踩踏等事故频繁发生,为社会带来严重的安全隐患。人群计数旨在估计各个场景下的总人数并呈现其分布,其在安全管理和流量监控等领域起着重要的作用。尤其当下新冠肺炎肆虐全球,人群流量预警及管控变得至关重要,作为最基本的人群分析方法,人群计数在近年来得到了广泛研究。本文针对复杂场景中人群密度不均、遮挡严重以及背景误判等问题,分别从网络结构和监督机制两方
随着视觉技术的蓬勃发展,人们从不同传感器获取的信息也越来越多样化。图像融合技术可以将特定场景下不同传感器得到的多种图像信息进行融合,得到包含互补的多源图像信息的融合结果,从而帮助人们更好的分析和处理复杂信息。其中红外和可见图像融合作为图像融合任务中的重要方向,将反映热辐射信息的红外图像和包含细节信息的可见光图像结合,得到突出红外目标以及具备更多细节背景信息的融合图像。早期的图像融合方法主要基于信号
《绝妙好词》是宋朝遗民周密编纂的一部南宋断代词选,分七卷本和九卷本两种版本形式。本文首次选用在前七卷本的基础上增加了余集《续钞》和徐懋《又续钞》的九卷本《绝妙好词》为底本,并将《绝妙好词》置于南宋词坛的大环境中,通过与南宋三部词选《草堂诗余》《花庵词选》《阳春白雪》以及南宋三种词论《乐府指迷》《词源》《词旨》,在入选词人、词数等方面进行对比分析,对蕴含于南宋词坛的选词标准和主流词学理论之下的《绝妙
城市书写是当代文学创作的重要组成部分。作为城市小说创作的代表性人物,邓一光自2009年移居深圳以来,创作重心逐渐从新革命历史小说转向城市小说。他在作品中讲述深圳故事,刻画“城中人”,为当代城市书写提供了个性化思考和崭新的表达方式,为彰显深圳城市文化的独特性进行了有益尝试。论文分为绪论、正文和结语三部分。绪论部分,整理归纳邓一光的小说创作及相关研究成果,梳理城市文学的发展脉络,明晰“城市书写”的概念
在互联网及其应用广泛流行的时代,人们对于信息的需求量与日俱增,图像作为高信息量的载体成为信息传播的主要手段。在图像相关处理中,失真会不可避免地对图像造成影响,使其丢失信息,为使得图像质量有所保证,需要对图像质量进行评价。目前,深度学习应用于图像质量评价方法中,其取得的大量研究成果使之成为该领域的主要研究工具。然而,大量的手工标记数据是深度学习的必要条件,这既昂贵又不实用。现有的图像质量评价数据库并
群体智能(Swarm Intelligence,SI)算法是一类代表性的启发式算法,它通过模拟自然界中真实生物种群的行为与其间的自组织交互而构造。作为一种典型的群体智能算法,粒子群优化(Particle Swarm Optimization,PSO)算法自从提出以来,就受到了学术界的广泛关注,并产生了众多变体算法。然而,目前的粒子群优化算法仍然存在一些问题,比如大多依赖于先验知识、搜索多样性不足,