面向癌症亚型预测的多组学表征和融合学习

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:xue5559
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
癌症亚型识别在揭示疾病发病机理和推进个性化精准治疗方面起着重要的作用。高通量测序技术的快速发展使同一组癌症患者的多种基因组学数据如mRNA表达数据、miRNA表达数据和DNA甲基化数据的收集成为可能。多组学数据可提供不同分子水平的患者遗传信息,通过提取多组学间的关联和互补信息,可以帮助准确识别癌症亚型并对相似患者聚类,从而根据患者实际情况制定治疗方案,避免无效治疗和过度治疗。因此,基于多组学融合进行癌症亚型预测研究对于精准医疗的发展具有重要意义。本文主要研究多组学的表征学习和融合学习方法,以提高癌症亚型的预测精度。本文的主要工作内容如下:(1)蛋白质的表达依赖多个基因互相协作,而目前许多多组学表征方法将每个基因视为独立的个体,忽略了基因间的相互作用,导致对组学特征信息提取不准确、不充分,影响了组学的表征效果。针对这个问题,本文将本实验室提出的基于基因相互作用的单组学表征模型HiGCN扩展到多组学表征学习,通过引入外部知识数据库中的基因间相互作用来补充组学信息,然后利用图卷积神经网络对组学数据建模,并在多组学融合模型MOGONET基础上,设计了基于基因相互作用的癌症亚型预测模型HiNet。在TCGA的多个公开癌症数据集上的实验结果表明,引入基因间相互作用信息可以帮助获取更好的组学表征。(2)组学数据具有高维度小样本特性,而多组学融合则会进一步放大该特性,导致严重的维度灾难问题,使得对癌症亚型预测效果不佳。针对该问题,本文提出了基于样本相似性的多组学表征学习方法,通过计算样本间相似性来获取样本间的关联,然后利用图卷积神经网络对样本进行信息聚集,并设计了基于该表征方法的多组学癌症亚型预测模型TeNet。实验结果表明,考虑样本间相似性可以帮助缓解维度灾难问题,获得更好的组学表征,提高模型的预测精度。(3)多组学的有效融合需要同时考虑单组学内在特性和多组学间的关联,但是现有的融合方法在融合过程中存在单组学内在特性丢失的问题。针对该问题,本文提出了改进的视图关联发现网络——iVCDN融合方法,并结合第三、第四章的改进,设计了基于iVCDN的多组学癌症亚型预测模型HiTeVNet,该模型根据每个组学的数据特性,采用不同的方法先对单组学数据进行表征和初步预测,再利用iVCDN对初步预测结果进行融合,在融合的过程中补充了丢失的单组学信息。本文在公开数据集上对HiTeVNet模型进行了对比实验,并通过组合实验探究各种组合模型的性能,最后进行了识别重要生物标记因子的实验。实验结果表明,补充丢失的单组学信息有助于改善多组学融合效果,从而提高模型的预测精度。
其他文献
改革开放以来,珠三角地区走上了“村村点火、处处冒烟”的农村工业化道路,形成了大量散落布局、低效利用的村级工业园。新时代下,村级工业园改造成为缓解建设用地指标紧缺、推动产业升级和激发衰退地区新活力的重要突破口。在“三旧”改造、村级工业园整治提升、产业用地政策创新等制度激励下,珠三角城市掀起了村级工业园改造的浪潮,积累了丰富的实践经验。学界对村级工业园改造的动因、改造模式、现实困境等方面进行了探讨,试
学位
近年来,全球气候变暖日趋严峻,极端气候现象频发。作为世界上最大的碳排放国家,2020年9月我国对世界作出了“力争2030年前达到峰值,努力争取2060年前实现碳中和”的承诺。土地利用碳排放是仅次于化石燃料燃烧的第二大碳源,而我国作为农业大国,耕地生态系统减排增汇是调控土地利用碳排放的重要内容,也是实现“双碳”目标的重要途径。而长期以来,包括耕地碳汇价值在内的耕地生态系统服务价值并未得到充分重视。耕
学位
深度度量学习旨在学习样本间的语义相似性,由于其天然的泛化优势,被广泛应用于图像检索等开放集场景。基于代理的深度度量学习方法通过常驻内存的可训练代理为mini-batch供训练集在嵌入空间的全局分布近似,通过探究样本与代理的关系避免了基于样本对方法中复杂的采样问题和mini-batch局部性导致的模型局部最优问题。在深度度量学习领域,一个常见观点是大边距有利于判别特征的学习,从而升模型对测试集样本的
学位
飞行员决策是重要的航空安全影响因素之一,而飞行员的风险决策倾向则能够在较大程度上影响飞行员的不安全行为。有研究表明具有风险偏好倾向的个体在决策时主动追求风险,具有风险回避倾向的个体在决策时则倾向于保守和安全。已有研究表明个体的风险决策倾向受到成就动机的影响,但未考虑到危险态度在其中发挥的作用,因此本研究聚焦于飞行员成就动机对风险决策倾向的影响,并研究危险态度和飞行经验在其中发挥的作用。本研究主要通
学位
目的 分析以助产士为主导的平产分娩产房护理模式对母婴的影响。方法 选取2017年4月至2020年3月在我院平产的产妇80例为观察对象。采用数字随机表法将其分为对照组和观察组,每组40例。对照组产妇行常规分娩护理,观察组产妇以助产士为主导行分娩护理。对两组产妇不同产程时间、母儿不良妊娠结局、分娩方式进行统计并行组间比较,对分娩护理的满意度进行测评并行组间比较。结果 (1)观察组产妇第一产程、第二产程
期刊
现今,民用无人机在各行各业都有着广泛的运用,因此,无人机飞行安全备受行业关注。由于民用无人机机载电子器件工作电压低,导致机载设备对电磁干扰敏感性较高。随着低空电磁环境日益严峻,对遥控数据链高度依赖的民用无人机电磁安全受到威胁,一旦电磁干扰经过电磁防护薄弱路径耦合至遥控数据链相关的电子器件,可能会导致无人机遥控数据链受扰甚至接收组件器件的损毁,国外对民用无人机遥控数据链电磁干扰效应的研究较少,国内的
学位
如今,飞机自动化程度越来越高,大多数航班人工飞行的时间只有5至10分钟,飞行员的角色从五人制机组中单纯的操作者,逐步成为飞机的操作者和自动化设备的管理者。但是民用运输航空所有起飞阶段和绝大多数着陆阶段,仍然需要人工操作飞机,而这两个飞行阶段也是飞行事故和不安全事件的高发阶段。因此,国际民航组织要求民航飞机安装快速存储记录器(Quick Access Recorder,QAR),同时进行飞行品质监控
学位
超声成像是临床医学上一种功能强大的无创诊断成像方式,无论在疾病预防或者诊断方面都有重要的作用。在传统的手持式超声扫描过程中,为了满足一定的接触条件,超声医师需要以固定姿势保持较长的时间,容易造成肌肉疼痛以及骨骼疾病等健康风险。此外,超声扫描过程中与患者的直接接触对于处于一线的超声医师来说存在着极大的被感染风险。而超声扫描机器人的出现可以有效地解决这些问题,并且可以实现标准化的图像采集,提高超声检查
学位
准确地估计胎龄(Gestational Age,GA)对于判断胎儿生长发育是否异常至关重要,是胎儿产前超声筛查的必检项目之一。临床上,医生通过交互地移动虚拟卡尺跟踪超声图像中的颅骨,腹部和股骨,并测量出相应的头围(Head Circumference,HC)、双顶径(Biparietal Diameter,BPD)、腹围(Abdominal Circumference,AC)和股骨长(Femur
学位
飞机火灾事故频发,造成巨大的人员伤亡和财产损失,消防员作为飞机火灾救援中的主力军,而消防服则是消防队员生命安全的重要保障,气凝胶的引入为改良消防服提供了新的思路。气凝胶是一种具有三维纳米网络结构的多孔固体材料,其具有低密度、低导热率、高比表面积、高孔隙率等特点。对位芳纶(Kevlar)是一种具有良好耐热和阻燃性能的有机高聚物。将Kevlar制备成气凝胶纤维势必兼具两种材料的优势,在热防护领域,特别
学位