基于基因表达数据和网络模型的胶质瘤重要基因识别及应用研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:cactusspine
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
胶质瘤占所有恶性脑肿瘤的80%,严重危害人类健康。目前对于胶质瘤的发病机制等认识不足,导致对其诊断治疗效果欠佳。人类基因组计划的开展产生了大量的潜藏丰富生物信息的数据,如何从中挖掘出胶质瘤相关重要基因亟待解决。本文则主要基于基因表达数据和网络模型,采用数据分析、网络拓扑信息挖掘以及网络动态分析三种筛选预测方法,来实现胶质瘤相关重要基因的识别,为胶质瘤发病机制等的进一步研究提供帮助。本文的具体工作说明如下:1)基于胶质瘤患者的基因表达数据,应用BMR-ReliefF结合SVM-RFE算法进行特征基因筛选,通过5折交叉验证找到了25个有效特征基因(AUC>0.85)。GO分析和PubMed文献查阅发现其主要富集的9个GO term和基因CDK6、NDRG1、MDK都与胶质瘤相关,说明该方法在胶质瘤基因筛选识别应用中的有效性。另外KEGG通路分析提示神经活性配体-受体相互作用信号通路及其相关的6个基因可能与胶质瘤存在重要关系,为进一步实验探究胶质瘤的发病机制提供了理论基础。2)基于疾病-基因异质网络,应用DeepWalk深度挖掘网络拓扑信息,提出DBSI(基于疾病相似的预测)和GBSI(基于基因相似的预测),经过适应性改进的5折交叉验证,发现DBSI预测效果优于GBSI(AUCDBSI=0.87,AUCGBSI=0.81),因此使用DBSI找到30个与胶质瘤相关的基因。生物功能富集分析提示基因IL1A、HLA-DQA等富集于细胞因子-细胞因子受体相互作用、TNF信号通路中,为探索其可能作为胶质瘤药物治疗潜在靶点提供参考。另外,发现主要富集的12个生物学过程和8个KEGG通路与胶质瘤密切相关,证明该方法预测识别胶质瘤相关基因有效。3)基于大脑基因调控网络模型,利用复杂网络可控性动态分析网络,依据节点删除后网络最小驱动节点数目变化进行基因分类(重要基因critical、非重要基因ordinary),找到重要基因集合。从网络拓扑性质、功能基因数据库富集、网络鲁棒性三方面分析验证结果,证明了该方法的强鲁棒性以及重要基因确实与胶质瘤相关。
其他文献
在计算与存储的虚拟化成为当前数据中心的一大热点,云计算技术得到广泛应用的今天,越来越多的企业选择将基础服务转移到云上,不断增加的业务、激增的用户数、海量的数据存储以及相应的高性能需求,使得云平台的规模不断变大,极大的增加了部署工作的困难程度。然而,部署环节在云平台的使用周期中是不可或缺的部分,在没有企业级的替换方案前,传统基于网络架构的自下而上的部署模式和复杂的管理机制难以满足现在的部署需求。因此
21世纪是我国全面推进素质教育的时期,学校音乐教育作为素质教育的主阵地,在这场历史性的教育改革中扮演了一个不可替代的特殊角色。教师作为教育的生力军,成为大家所关注的
今天,行政机关负责人出庭应诉已不再是什么罕见的事情,与过往相比较,出庭应诉率明显提升,这对行政争议的解决,能够起到一定的积极作用,并在一定程度上会改善官民矛盾。不过,此项制度自推行起始终存在部分问题尚未解决,本文以行政机关负责人出庭应诉的概念作为切入点,分析与探讨行政机关负责人出庭应诉制度具有的意义。现阶段,对行政机关负责人出庭应诉问题,我国尚未建立起成熟的制度,存在立法不完善、运行状况不佳、监督
在物理世界中,多相流的分布非常广泛,但是因为温度、气压等环境的影响,其介电常数不会恒定不变。在被测场域中不会仅仅只存在一种介质,常常是多种介质混杂的情况,这就导致无法对介质数量和介电常数的实时检测。并且多相流还具有繁杂的流动特性,这就造成无法用一般的数学模型进行完整描述的问题,所以实际应用中的测量就会非常困难。现今,针对多相流的实时检测与图像重建的实验,大多处于仿真验证阶段,尽管有一些成果已经投入
云以及移动互联网在近几年内飞速发展,各类应用对存储的读写性能与容量表现出更高的需求。非易失内存具有堪比内存的延迟与带宽,满足很多低延迟应用的需求。而非关系型数据库之中的键值系统(Key-Value,K-V),凭借高性能,强扩展性,使用灵活等诸多优势,在业界受到研究者的青睐。日志结构合并树(Log-Structure merge tree,LSM-Tree)是KV存储系统普遍采用的索引结构,通过将随
目的:急性肾损伤(Acute Kidney Injury,AKI)是临床中的常见并发症,在ICU中发病率较高、死亡率高,医疗花费成本高,对急性肾损伤进行早期预测预警有助于辅助医护人员及早识别患者的恶化风险,在早期对患者进行干预以预防进一步的损害。随着电子健康档案的发展以及数据挖掘、机器学习方法在医疗领域中的应用,我们得以用大数据的研究方法对医疗数据进行挖掘,探究疾病的演化规律,这为我们深入研究AK
随着大规模深度学习算法的发展,自然语言处理领域重新掀起对开放域下对话系统研究的热潮。同时社交媒体的影响力快速传播,网络上可获取的海量数据也为研究者们构建数据驱动型的智能聊天系统提供了极大地助力。然而鲜有人将目标聚焦于分析对话主题,以引导用户进行更有意义的谈话上。当前在开放域下聊天机器人的研究中,较为主流的方法是基于深度学习的序列到序列框架。在这样的技术支持下,考虑将对话的主题信息融入基础框架,提出
父亲查日坤生前保存有一幅照片,摄于何年何月不详。照片的背景是一个大会会场,背景显得很零乱。会场横幅是"军党分立宣誓大会",大横幅上部又有一小横幅:"保持崇高党性"。会场
期刊
研究目的:研究4种自酸蚀粘接剂所含酸性单体与牙本质主要成分羟基磷灰石晶体(hydroxyapatite,HAP)之间的化学相互作用,进一步分析其对牙本质粘接效果的影响,以期更加深入的理
随着信息化时代的到来,企业之间的竞争变得越加激烈,表现为企业信息化之间的竞争,因此信息化管理对于企业发展至关重要。特别是制造型企业,通过信息化管理系统来对企业供应质量进行管理可以大大提高企业工作效率,减少成本开支。对于制造型企业,供应质量管理是提高产品质量的基础。对采购物料进行严格的质量监控,通过物料的接收,验收,以及不合格物料的处理,层层监控采购物料的质量,对保障企业产品质量具有十分重要意义。而