基于图机器学习的微生物网络关系预测算法研究

来源 :湖南大学 | 被引量 : 0次 | 上传用户:abc123student
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
21世纪以来,生命科学的发展日新月异,人类探索生命奥秘和维护人体健康的需求更加迫切。随着人类基因组计划的完成,研究者们逐渐意识到微生物是人体不可分割的一部分,而且对人类健康和人体疾病具有重要影响,因此开展了各种人类微生物组计划。从系统水平对微生物网络展开研究,从而揭示微生物在人类复杂疾病中的致病机制,成为了当前生物信息学和计算生物学领域重要的研究热点之一。随着高通量测序和筛选技术的快速发展,产生了大量微生物组学、宏基因组学、宏代谢组学、基因组学、蛋白质组学等生物医学数据,这为微生物组研究提供了宝贵的资源。然而,如何挖掘和提取这些数据中蕴藏的价值巨大的信息仍然是一项重大挑战。针对微生物关联网络的系统研究对于深入理解微生物的致病机制、促进药物的发展和推动微生物在精准医疗中的应用以及为疾病的预防、诊断和治疗提供理论依据具有重要意义。然而,采用传统的实验方法探索微生物面临着周期长、高成本、高风险等诸多挑战,高效的计算方法提供了一种有效且经济的补充策略。本文以生物网络为工具,以深度学习等技术为手段,主要针对微生物-疾病关联关系识别、微生物-药物相互作用关系预测等任务相关的算法进行了研究,主要研究工作概述如下:(1)针对大多数已有基于随机游走的微生物疾病关系预测算法忽略了网络拓扑特征信息、当前用于微生物-疾病关系预测的计算模型预测效果欠佳等问题,提出了一种融合网络拓扑特征信息的随机游走算法NTSHMDA用于识别微生物疾病关系。首先基于微生物-疾病已知关系数据,采用高斯核相互作用谱方法构建微生物-微生物、疾病-疾病相似性网络,并结合微生物-疾病二分网络构建异构网络。然后,基于不同邻居的重要性可能存在差异的假设,通过融合网络拓扑特征信息对微生物-疾病的边权值进行了重新评估,为更重要的邻居分配更大的权值。根据特征信息的不同来源,建立了两个分别基于微生物空间和基于疾病空间的全新异构网络。最后,通过分别执行随机游走算法于两个全新的异构网络推断微生物-疾病关系。交叉验证实验结果表明,相比已有算法,NTSHMDA在微生物-疾病关系预测任务中能够取得更大的AUC值。(2)针对当前微生物-疾病预测算法普遍对已知微生物-疾病关系依赖性强、大多数已有算法无法实现对于缺乏已知关联数据的新微生物和新疾病的预测等问题,提出了一种基于图注意力网络的深度学习模型GATMDA来识别微生物-疾病关系。首先,考虑到基于已知微生物-疾病关联数据无法获得新微生物和新疾病特征的问题,GATMDA借助多种生物医学数据建立丰富的微生物和疾病特征。然后,为了避免信息丢失和加强表征学习,通过建立自注意力网络间的信息传播对标准图注意力网络进行优化,并用优化图注意力网络学习节点表征。随后为了更准确地融合节点自身表征和邻居表征,设计了基于多层感知机的双重融合器。最后,为了识别复杂的微生物-疾病相互作用关系,借助矩阵填充技术对微生物-疾病二分网络进行重构,以推断微生物疾病关系。三种不同实验场景下的实验结果表明,GATMDA相比对比算法具有更好的预测表现,而且能够适应于缺乏已知关联数据的新微生物和新疾病预测。(3)考虑到目前微生物耐药性问题日趋严峻、新药物的研发速度极其缓慢等问题,本文提出了一种基于图卷积网络的微生物-药物相互作用预测模型GCNMDA。首先,结合高斯核相似性、药物化学结构相似性和微生物功能相似性建立了药物-药物相似性网络和微生物-微生物相似性网络,为了提取重要的特征和过滤噪音,进一步借助随机游走算法改善了药物特征和微生物特征。然后,鉴于条件随机场(Conditional Random Field,CRF)在识别相似性节点方面的优势,在标准的图卷积网络中添加了CRF层,以使得相似性的节点能够学习到相似的表征向量,而且为了捕捉不同邻居的重要性,在CRF层中进一步引入了注意力机制来加强重要邻居的特征融合。最后,根据第二步中学习到的节点表征,通过重构微生物-药物二分网络来预测微生物药物关系。基于三种不同密度的数据集的实验结果表明,与其它算法相比,GCNMDA模型在三个数据集中均表现出了更优的性能,而且对于数据集密度的变化具有较强的容抗性。(4)上述GCNMDA模型虽然在不同的数据集上都表现出了较好的预测表现,但是其预测准确率仍然有进一步改善的空间,而且GCNMDA模型并不能为所有的新微生物和新药物实现相关预测。为了解决上述问题,提出了一种新的基于集成图注意力网络的深度学习模型EGATMDA用于微生物-药物关系预测。首先,该模型有效利用了微生物基因组序列数据建立了微生物特征,结合药物化学结构信息和药物高斯核相似性建立了药物特征,同时通过整合多源生物医学数据构建了多种异构网络。然后,由于在同一个网络中不同邻居可能对指定节点产生不同的重要性,而且对于指定节点不同的图可能包含不同的语义信息,因此本文设计了双重注意力机制来学习节点表征。最后基于节点表征通过重构微生物-药物相互作用网络预测微生物药物关系。实验结果表明,EGATMDA比对比方法能够取得更大的AUC和AUPR值,而且新微生物和新药物预测场景下的结果证明EGATMDA能够成功实现新微生物和新疾病的相关预测。综上所述,人体微生物在人类健康和疾病中扮演着举足轻重的作用。本课题拟从计算信息学的角度出发,基于大量的生物医学数据,结合图机器学习和网络科学技术对微生物相关问题进行建模和分析,提出了多种适用于致病微生物识别以及微生物-药物相互作用关系预测的计算模型,对于促进微生物致病机制的理解、加速新药物的发展和推动微生物在个性化治疗、精准医疗领域的应用具有重要意义。
其他文献
汽车车身主要由金属薄板件焊接构成,金属薄板件的焊接质量是车身制造质量的关键因素。车身焊接质量的主要指标包括金属件焊接后的尺寸精度与焊接强度。本文以车身金属薄板件的焊接质量优化为主要研究内容,运用大数据分析、数字化虚拟仿真、人工智能等技术,分析车身焊接质量相关的影响因素,并针对影响因素进行优化改善,同时建立相应的改善流程与方法,提升车身焊接质量的智能化控制水平。本文所开展及完成的主要工作及创新点如下
当前,在提倡创新驱动的全球大背景下,高端制造与信息技术持续融合,以主导企业为核心,连接供应网络的平台商业模式正在颠覆传统的创新方式。模块化创新平台由主导企业提供基本创新架构,各模块供应商在此基础上进行互补创新,通过精细分工和有效整合,实现深度合作和协同创新。要充分利用模块供应商的优势和资源,组织模块供应商进行更好地协同创新,主导企业必须与模块供应商建立并保持稳定协调的沟通和合作机制,即关系治理。平
氨作为一种重要的农业化肥原料,需求量持续增长。传统的Haber-Bosch合成氨方法存在高耗能、高成本及高污染等缺陷。而电催化技术可在常温常压条件下实现氨合成,有望成为工业化合成氨的替代工艺。研究者已发现众多材料有望成为高效的合成氨电催化剂。但是,电催化合成氨技术的工业应用仍然存在不少的困难与挑战。除了催化剂本身的反应活性较低以外,实验环境中的氨污染也导致一些催化性能的测试结果存在争议。因此,系统
对存在未知干扰的复杂体系中感兴趣的多个组分进行直接、快速、同时和准确定量分析是一个颇有挑战性的分析科学难题。随着高阶仪器的发展和化学计量学的深入研究,化学多维校正方法在解决这一难题中发挥着重要作用。目前,化学多维校正方法与高阶分析仪器相结合拥有独特的“二阶或高阶优势”,与传统的定量分析方法相比,化学多维校正能通过“数学分离”代替或增强“物理或化学分离”,无需昂贵的分离设备和繁琐的样本前处理步骤,在
随着科技的不断进步,电力机房自动化与智能化水平逐步提高,这也对电力机房的巡检工作提出了更高要求。传统巡检方法存在一些问题,如时间长、效率低、耗费人力物力等,极大地影响了巡检效果。文章主要研究5G技术在电力机房巡检中的具体应用,介绍了“5G+AR”和“5G+机器人”两种智能巡检技术。应用5G技术,依靠其延迟低、速率高、连接广等优势,可以实现电力机房的智能化巡检,进一步提升巡检效率,保证电力系统的安全
目前,以新能源汽车为代表的机械设备动力源正在从传统高排放、高污染的内燃机转变为环保、高效的新能源电池,同时,为了满足动力电池的动力性和续航能力,研制具有大容量、循环寿命长、倍率性能好的新能源电池成为行业发展的研究焦点。目前应用较为广泛的是节能环保、具有较高能量密度以及较长循环寿命的锂离子电池。但是,锂资源的稀缺和分布不均限制了其进一步的应用。与此同时,钾离子电池因其成本低、储量丰富、标准电极电位低
有机固体废物的热解处置是一项双赢策略。一方面可以实现其资源化处置,另一方面得到的生物炭可以作为环境功能材料,应对当前水体有机污染危机,实现以废治废。但是,不同原料和方法制备的生物炭对有机污染物的去除性能(包括吸附和催化)存在明显差异,但其微观结构与性能之间的关系尚不明确,无法有效地指导制备高效的生物炭功能材料。因此,本论文以不同有机固废为原料,辅以系列结构调控手段,制备了系列生物炭功能材料;并分别
进入本世纪,科学技术发展速度着实令人叹为观止。各种器件越来越微纳化,集成化。相较于传统的电子器件,光子器件具有独特且优异的特性。然而,早些年的光子器件受光学衍射的限制,无法更进一步超小型化,达不到高度集成器件的要求。现如今,表面等离激元就能够极其有效地解决这些技术困难。由于其能完美突破光学衍射限制,许多研究者将目光转向它,这为有效解决上述问题提供可能性。本文主要基于表面等离激元波导结构,分析其对入
稗草(Echinochloa crus-galli L.)是稻田中最具危害的恶性杂草,化学除草剂能有效控制稗草发生,然而除草剂的过度使用会造成环境污染,并使得杂草发展出抗药性。开发和应用杂草综合管理方法可以减轻水稻生产对除草剂的依赖,为绿色农业生产提供保障。本研究以化感植物小飞蓬为堆肥原料,制备可用于水田稗草防控的有机控草肥,并对控草肥所含抑草成分对稗草幼苗生长的抑制作用进行了研究。此外,通过室内
实践证明,改革开放这一制度创新举措是中国经济取得飞速发展的法宝。在当今中国特色社会主义建设进入新时代的重要历史时期,国家经济发展的目标已经从过去单纯地追求快速发展转换成了高质量的发展,要成功地实现这一转换,仍然需要制度创新作为保障。当前普遍认为,中国经济社会发展中存在的最为突出的问题包括城乡发展不平衡,环境污染严重,创新能力不强以及产出效率不高等。针对这些主要矛盾与问题,国家相继出台了多项政策、采