面向复杂生物网络的功能模块识别算法研究

来源 :武汉理工大学 | 被引量 : 0次 | 上传用户:aigufeixi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
生物网络是用图模型来抽象表示生物复杂系统的一种复杂网络。比如,蛋白质相互作用网络、基因共表达网络、信号传递网络和生物代谢网络等都属于生物网络范畴。在后基因组时代,面向复杂生物网络的功能模块识别算法研究是一项十分重要的研究方向,有助于人们在生命起源、新型药物开发、疾病机理研究等众多领域有更进一步的理解和认识。随着高通量技术的发展,生物组学数据量急剧提升,如何在如此大量的网络数据中识别具有生物意义的功能模块是一项巨大的挑战。尽管传统的实验室技术能够准确识别生物网络中的功能模块,但其缺点也是十分明显,需要消耗大量的人力物力,性价比较低。因此,利用计算模型对生物网络中的功能模块进行识别已经成为了主要手段。尽管现有的生物网络功能模块识别算法在准确性方面已经取得一定的效果,但还存在一些问题,比如无法有效地识别可重叠的功能模块,以及忽视了生物网络中所具有的丰富高阶结构信息。针对这两点,本文主要进行了以下工作:(1)本文提出了一种基于链接的可重叠蛋白质复合物识别算法,即LADOC。作为蛋白质相互作用网络中的功能模块,蛋白质复合物的可重叠识别问题是研究的难点之一。我们首先结合相互作用网络的拓扑结构和蛋白质的属性信息来度量两两蛋白质对之间的相似性。然后,将蛋白质复合物的识别问题转化为基于链接的优化问题,并提出LADOC算法来解决该优化问题,揭示了蛋白质复合物和蛋白质相互作用之间的内在关联性。与实验中使用的其他蛋白质复合物识别算法对比,LADOC在4个网络的3个中都被列在几项评估指标中前三名,4个网络上MMR的分数始终第一。在重叠蛋白质复合物识别的应用上,也有较高的准确性。(2)为了充分利用生物网络中所具有的丰富高阶结构信息,本文提出了一个新的聚类框架,即Hi SCF,以提高功能模块识别的准确性。Hi SCF引入张量数据结构表示三角形模体和四边形模体等高阶结构信息,并通过高阶马尔可夫链描述在高阶结构中的随机游走过程。在此基础上,Hi SCF将高阶马尔可夫链转换成一阶马尔可夫链,并采用传统的聚类方法完成功能模块识别的任务。将Hi SCF与现有的功能模块识别算法进行比较,Hi SCF在蛋白质复合物识别和基因共表达模块检测这两种实际生物应用中取得了更为出色的表现。Hi SCF的优势包括:(i)弥补了多数聚类算法使用低阶结构信息的不足之处;(ii)Hi SCF只需更改张量的定义即可实现更高阶结构的聚类;(iii)使用高阶结构在重叠功能模块识别上有着很好的效果。根据Hi SCF与其它算法的对比结果,在蛋白质复合物识别实验中,Hi SCF有着最高的MMR分数,f-measure分数也始终在前三,在基因共表达模块检测的实验中可以检测到更多的共表达模块。同时在功能模块识别的实际应用中,证实了该算法在重叠复合物识别以及基因共表达网络模块检测的应用中都稳定可靠。
其他文献
以2007—2021年沪、深A股上市公司为研究样本,采用文本分析法构建数字化转型程度指标,从微观企业层面探究数字化转型对于全要素生产率的影响及作用机制。研究发现,数字化转型可以显著提升企业全要素生产率,这一结论经过一系列内生性和稳健性检验后依然成立。路径分析表明,企业数字化转型通过加强内部控制、推动技术创新、优化人力资源结构的途径提升了全要素生产率。异质性分析发现,数字化转型对企业全要素生产率的促
期刊
人脸属性迁移是一种计算机视觉与图像处理领域中有效降低编辑图像复杂性的图像处理技术,被广泛应用于辅助人脸识别、人机交互和娱乐社交等领域中。人脸图像的属性特征之间存在较强的关联性,添加微笑、摘除眼镜、改变性别等复杂的人脸图像编辑会涉及关联性特征的变化,为了得到更好的人脸图像编辑效果,本文基于生成对抗网络分别对端到端和连续化两种多图像域人脸属性迁移方法展开研究和改进。主要工作如下:(1)针对采用离散形式
学位
文章对企业数字化转型中的影响因素和实施策略进行了陈述,并分析了成功案例和经验,得出了要注重数字化基础设施建设、管理和应用数据资产、积极推动数字化文化建设的结论,最后预测了企业数字化的机遇和前景。
期刊
随着智能设备存储和传输能力的提升,移动边缘计算网络中距离较近的用户可通过设备-设备连接共享视频内容。然而考虑到提供视频协作服务的中继传输节点个体利益,基于移动边缘计算的视频协作传输系统仍面临许多潜在的问题。首先是中继传输节点存在隐私数据泄露的风险,其次是移动特性导致视频服务质量难以量化,最后是用户间社会属性影响D2D通信链路的建立。因此有必要针对上述问题设计合适的激励机制,促进能够提供高质量视频服
学位
得力于深度学习技术,现阶段语音合成过程已得到极大地简化,合成语音的自然度也得到了极大地提高。但在中文语音合成领域中仍存在着一些难点和特色:(1)当使用音素作为输入时,中文语音合成模型需要前端处理网络将中文文本转化为音素,并且现阶段缺少开源的<文本,拼音>数据集进行模型训练;(2)中文语音合成模型存在训练时间较长、合成质量有待提高的问题;(3)语音克隆模型存在合成语音相似度不高的问题。本文围绕中文语
学位
随着卷积神经网络(CNN)技术的不断发展,为完成更复杂的特征提取任务、获得更高的识别精度,CNN的层次越来越深,计算量与参数量也越来越大,这使CNN算法对所部署设备的计算资源、内存资源以及能量资源有越来越高的需求。然而,在许多现实应用中,需要广泛地将CNN技术应用到计算资源、内存资源以及能量资源受限的移动嵌入式设备中,而且这些设备往往有着实时性、低功耗的要求。因此,对CNN的计算速度、计算能效以及
学位
内河运输是交通运输的重要组成部分,随着在航船舶数量的不断增长,各种水上交通事故数量也随之增加。船舶自动识别系统AIS通过内置的GPS或北斗定位模块向周边广播船舶自身的位置及其他信息,实现船舶的导航与避碰。但由于播发周期较长及信道共享抢占而产生的丢包问题,无法满足桥区港区等重要水域实时监管的要求。在重点监管水域,通常由AIS与雷达共同组成船舶交通服务系统VTS,以满足实时监管的要求。然而,现有VTS
学位
智能设备的日益普及,机器学习的不断发展以及网络数据的指数级增长给无线通信网络数据的收集、传输与处理带来了如下挑战:机器学习技术的发展离不开巨量数据的驱动,然而随着互联网用户对于数据隐私和信息安全重视程度的不断提高,无线网络中持有数据的分布式客户端节点出于对隐私泄露的担忧,向服务器传输数据的频率逐渐降低甚至拒绝传输数据,这导致大多数行业的数据逐渐呈现孤岛现象。由此,可有效保护分布式数据隐私的联邦学习
学位
智能交通系统(Intelligent Transportation System,ITS)的快速发展和急剧增长的车辆应用对车辆通信网络系统提出了重大挑战。为了在道路上建立稳定的车辆网络,基于节点地理位置分布的车辆雾计算(Vehicular Fog Computing,VFC)网络受到了广泛的关注。通过建立车辆雾计算网络,可以将云计算服务扩展到处于网络边缘的道路上,为车辆提供低时延高可靠的各类服务。
学位
本文利用文献研究分析中小企业数字化转型现状,发现数字化转型过程中面临的困境涉及资金来源、技术基础、组织架构、战略柔性等诸多方面,利用TOE框架分析影响中小企业数字化转型的因素,发现中小企业完成数字化战略转型涉及到多种因素,企业转型过程中应注重各方面协调配合,统筹推进企业转型。本文丰富了针对中小企业实施数字化转型的一些相关研究,以期为推动中小企业开展数字化转型减轻现实困难,提供方法指导。
期刊