基于微阵列技术的差异基因与差异网络识别研究

来源 :华中师范大学 | 被引量 : 0次 | 上传用户:a287924625
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
利用可靠且准确的特征选择方法识别不同状态之间的差异表达基因及其交互作用在疾病诊断和预后中起着重要的作用。然而,基因组学数据一般具有小样本和高维特征的特点,这给基因组学分析带来了极大的挑战。目前已经有很多基于这种高维数据的统计方法来探索其差异表达基因和基因共表达网络。本文的研究内容主要分为两个方面:(1)构建了一个识别微阵列数据的差异表达基因的统计模型;(2)构建一个新的统计模型探索基因共表达网络的重布线模式。目前大多数方法主要通过假设检验来确定癌症的微阵列数据中的单个基因是否有差异表达。由于癌症的微阵列数据一般存在噪音,因此不能通过直接分析这些数据来检测癌症相关的基因。进而,需要新的统计方法来分析微阵列数据中基因表达水平的差异。在第一项研究中,我们使用学生t统计量来分析乳腺癌的微阵列数据。相同的基因在不同的数据集中可能有不同p值,我们将整合不同样本集中相同基因的p值来联合分析基因的差异表达水平。基于这种整合多个独立数据集的学生t统计量的p值思想,我们提出了一种新的整合多变量的群稀疏(IMGS)模型。这个模型可以学习有关乳腺癌数据中的差异表达基因。在乳腺癌的微阵列数据集中,我们将由稳定性选择确定调优参数的IMGS模型与学生t统计量方法以及元分析模型进行比较分析。实验结果表明,我们的方法比对比模型的结果都好。在高维数据的条件下,尽管所有方法都能合理的识别出真正差异表达基因。在关于基因表达数据的生物医学分析中,IMGS方法是一种更为合适的确定显著性基因的统计方法相对于对比方法。本文的第二项研究主要是通过建立一种新的统计方法来确定基因共表达网络中的中枢基因。基于推断泛癌症数据的过表达基因的特有模式,我们提出了一种新的整个差异基因共表达网络(IDCG)模型。我们采用皮尔逊相关系数刻画基因表达数据间的相关性和Fisher z变换初始化模型。IDCG模型是一种较为合适的统计分析方法来推断泛癌症数据的相关基因。同样,我们采用稳定性选择方法确定调优参数。共表达数据可以富集不同癌症的基因表达信息,这有助于对每种癌症中的中枢基因进行功能性分析。基于IDCG网络方法确定的功能基因具有相似或相同的表达模式,这有助于揭示泛癌症研究中潜在分子机制以及其差异共表达模式。
其他文献
蓝藻是地球上最早出现的原核放氧光合生物,广泛分布于陆生和水生生态系统,对全球初级生产力和生物固氮具有重要作用。由于光合作用需要太阳光提供能量,因此蓝藻不可避免地暴露于地球表面的紫外辐射。在长期生命进化历程中,蓝藻已进化出应对紫外辐射的适应性机制,例如产生类孢菌素氨基酸(Mycosporine-like amino acids,MAAs)作为抗紫外物质等。MAAs是一类无色的水溶性紫外吸收小分子物质
有关脑科学的探索已经在许多领域中展开,目前研究的比较成熟的是神经元动力学,它利用数学模型、理论分析和计算机模拟来研究生物学上神经元和神经系统中真实的生物物理模型。神经元电活动和信息处理在神经系统中有很重要的作用,不同的神经元放电模式代表着不同编码意义和生物功能。在耦合的神经网络中,神经系统受高频刺激影响所引起的振动共振、触发同步以及弱电信号的传播等现象,都与大脑的生理功能有着密切的关系。由于电磁场
在自然界中,离子通道作为一种“智能”门控来实现特定目标分子和离子的选择性运输,因而在维持正常的生理行为中起着重要的作用。但是生物通道一般较为脆弱,且仅仅在脂质膜中发挥作用,因而很难直接将其运用到人工系统中。与生物通道相比,固态纳米通道不仅具有生物通道的性质,且其物理性质稳定和表面化学易于修饰,如纳米孔道的形状及孔径具有较好的可控性、稳定性,纳米孔道内壁修饰多样性等,逐渐引起人们的广泛关注。但是,在
Ds+→KS0K-π+π+作为Cabibbo允许的衰变过程,具有分支比大,本底污染少的特点,因而在Ds测量中常被用作标记过程。CLEO-c实验组分别于2008年和2013年用4.17 GeV质心能量处所采集到积分亮度为298和586 pb-1大小的数据样本两次报告了该过程的分支比,其结果受限于统计量少,中间过程不明确导致探测效率不精准。可见,用振幅分析的方式研究Ds+KS0K-π+π+衰变的内部结
图的谱理论是图论的重要研究领域之一,其核心是通过相关图矩阵的代数性质刻画图自身的结构特征,研究图的结构参数与图谱参数之间的内在联系.本文主要研究混图的谱参数(包括H-秩、Hermitian能量、特征多项式等),结构参数及其相关问题.具体研究内容如下:●在第二章中,我们首先利用混图的秩与子图结构的关系,确定给定最大度数条件下n阶混图的零度的上确界,以及达到上界的极图结构.其次,考虑混图DG的H-秩r
计算思维是当前高度信息化智慧时代的重要技能,是K12学习者必不可少的基本技能之一。当前,各发达国家相继把计算思维作为国家人才培养的核心,探索从小学阶段培养计算思维的理论框架和创新课程。我国自2018年1月正式将计算思维作为高中信息技术学科的核心素养,开始重视对计算思维的培养,并逐步向基础教育移步。随着计算思维培养的逐步推进,伴随教学改革的稳健步伐,我国小学传统的单学科教学知识融合不充分、学生被动接
本文主要研究几类含临界指标的非线性偏微分方程解的存在性与多解性.本文共分为五章:在第一章中,我们将对本文研究问题的背景和国内外研究现状做概述,并简要介绍本文的主要工作,相关的预备知识以及一些常用的记号.在第二章中,我们研究了下列含Kirchhoff算子的Choquard方程其中 a ≥ 0,b>0,α∈(0,N),2α*=N+α/N-2是关于 Hardy-Littlewood-Sobolev 不等
标准模型是粒子物理学中最成功的理论模型之一,对三种基本相互作用力(强相互作用力、弱相互作用力、以及电磁相互作用力)以及物质世界最根本的组成粒子,做出了非常成功的理论描述,同时对绝大多数实验现象做出了有效的预言和解释。夸克模型是它的重要组分,夸克模型自建立以来成功的预言了超过一百种强子态的存在。在夸克模型中,SU(4)理论预言存在含有两个粲夸克的重子,即双粲重子,但是长久以来并未有任何实验观测到此类
在信息论中,一般采用将信息划分为独立信息单元的方法来分析噪声信道.随着存储技术的发展,人们发现在输出成对重叠符号的symbol-pair读取信道中,符号的读与写并不总是一致的.2010年,国外学者Cassuto和Blaum为了抵抗symbol-pair 读取信道中产生的符号对错误提出了 symbol-pair 码的概念.Symbol-pair 码的极小symbol-pair距离对其纠错能力起着关键
本文主要介绍高弹性包心奶香鱼糜制品的开发背景及工艺流程、技术特点。通过将内馅料、外皮浆料加入自动成型机中成型,制得包心鱼糜制品,然后将初步成型的包心鱼糜制品再依次通过定型、固型、冷却、急冻、检验、包装、冻藏等工序,加工出一种内馅奶香味浓郁具有高粘弹性、热拉丝效果好,外皮高弹性的鱼糜制品,不仅口感佳,风味浓,还能提升海产品的附加值。