RNA-seq动态数据的基因调控网络再构建

来源 :北京林业大学 | 被引量 : 4次 | 上传用户:liuyu890501
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
RNA-seq技术是后基因组时代功能基因组学研究的重要工具,可以量化生物在不同发育阶段以及不同环境下全基因组的转录水平,有助于研究者解析其内在的基因调控机制。然而,在获得高维复杂的RNA-seq数据后,如何进行深入的分析以挖掘重要的功能基因或者模块仍旧是一个亟待解决的重要问题。基因调控网络构建是RNA-seq数据分析中一种重要的手段,可构建基因之间的互作关系,从而确定关键的调控枢纽以及调控关系。现阶段基因调控网络构建的方法有多种,但这些方法还存在诸多不足。在本研究中,首先,考虑RNA-seq数据的离散性、高维性以及基因调控网络构建中的时空性,基于Skellam分布发展了一种新的聚类方法,降低基因表达数据的复杂度;第二,为进一步量化基因之间的互作效应以及克服现有网络构建中的边际效应,将博弈论与高维系统常微分方程相结合发展了一种全新的基因调控网络构建方法。当生物的生存环境发生改变时,其整体的基因调控会发生改变以适应新的环境,从而在空间水平产生基因的可塑性表达。针对RNA-seq数据的离散特性以及基因的可塑性表达,基于Skellam分布构建有限元混合模型,并在混合模型框架下对估计未知参数的EM算法进行推导。使用AIC准则确定最佳的聚类数。在获得基因聚类的基础上,提出两类具有生物学意义的假设检验对聚类内基因的差异表达以及不同聚类之间的表达模式是否存在差异进行检测。利用计算机模拟研究评估不同初值参数获取方法、基因表达数据不同标准化方法对新方法聚类性能的影响以及不同聚类方法在可塑性表达数据中的聚类性能。模拟研究表明基于模型的参数初值选择方法下聚类性能最高,标准化方法对聚类性能影响较小,与K-means以及SOM方法相比,新方法的聚类性能最高。模拟研究对新聚类方法的最佳聚类数量选择以及统计功效的检测表明AIC准则可准确选择出真实聚类数;每个聚类的估计参数与真实参数值比较接近。对胡杨盐处理根部动态转录组数据进行了初步分析,将获得的差异基因使用新的聚类方法进行分析,检验新聚类方法的适用性,同时挖掘与胡杨抗盐相关的可塑性表达模块。实际数据分析表明模块4是重要的可塑性表达功能模块。对实际数据分析获得的可塑性功能模块与差异基因GO分类的结果进行比较,结果表明新聚类方法表现出较好的性能。假设检验表明模块内基因在两个条件下动态表达呈现显著差异,而且不同聚类之间的表达模式显著不同。基因调控网络是一个复杂的动态高维系统,基于进化博弈论思想,结合高维常微分方程在系统水平刻画基因之间复杂的线性与非线性博弈关系以及量化基因之间的互作效应,基因之间的博弈关系可分为6类,分别为“双赢”、“两败俱伤”、“损人利己”、“助人为乐”、“损人不利己”以及“相安无事”。整合模型的参数估计方法,在最大似然估计或者非线性最小二乘框架内提出具有生物学意义的假设检验对系统内存在的互作基因进行检测;对估计的参数或互作效应曲线之间的博弈关系进行解释。基因调控网络的构建实施过程分为四步:第一,基因表达的可塑性表达聚类分析,降低数据的复杂度;第二,对聚类平均表达值或基因表达值进行平滑估计;第三,利用group LASSO和adaptive group LASSO技术完成显著互作基因的初步筛选;第四,对初步筛选的基因构建高维ODE,然后基于非线性最小二乘框架进行假设检验获取基因之间的博弈关系并估计基因之间的互作效应进而完成基因调控网络的构建。在实际数据分析中,利用新发展的基因调控网络构建方法所构建的可塑性表达模块网络中发现3个重要的枢纽模块,其中枢纽模块4包含大量的转录因子。对枢纽模块4所有基因进行基因调控网络的构建发现重要的枢纽基因中存在转录因子ERF061以及BHLH92等,这些转录因子可能与胡杨响应盐胁迫有关。在实际数据分析中,与其它方法相比,新方法构建的基因调控网络具有更好的生物学内涵,枢纽基因与胡杨的抗盐有较大相关性。计算机模拟研究表明新的方法具有较好的性能,与其它方法相比,真阳性率较高,假阳性率较低,且能够准确估计基因之间的互作效应。新发展的可塑性表达聚类方法能够挖掘基因的可塑性表达模式,在降低数据维度的同时,融入基因表达的时空模式,为基因调控网络的构建奠定基础;在可塑性表达聚类基础上,基于博弈论思想结合ODE所构建的调控网络在系统水平量化基因的互作效应。所开发的新方法适用于大尺度的动态RNA-seq数据分析,基于新方法所开发的开源软件可在网站ccb.bjfu.edu.cn自由下载。
其他文献
目的探讨电化学发光(Elecsys)与液质联用(high performance liquid chromatographytandem mass spectrometric,HPLC-MS/MS)检测骨髓移植患者环孢素A(Cyclosporin A,CSA)血药
白念珠菌作为条件致病菌寄生在健康人体的口腔和小肠粘膜中,当机体免疫力低下时,其可侵入机体引发系统性感染。系统性白念珠菌感染是最常见的院内真菌感染,包括念珠菌血症和
风险理论是保险精算学的一个分支,它研究保险人在总赔付成本中的变异性以及这种变异性与保险人承受能力之间的关系。风险理论研究的主要内容有:损失分布理论;总体风险模型理论;
16区块位于苏丹北部红海州,区内已发现金矿点11处,铜矿点6处,优选出了4个成矿远景区,评价了小型金矿床1处。该文介绍了16区的成矿地质条件、矿化特征及矿化类型,以已评价的小
高校具有丰富的体育设施和体育教育人才,为社会体育专业人才的培养提供了充足的物质资源和人力资源。高校社会体育专业人才实践基地的建设不仅要着眼于学校,更应该面向社会体
这条路,承载着脱贫致富的希望。这条路,架起了党心民心的桥梁。铺下的是路、竖起的是碑、连接的是心、畅通的是富。今年,是习近平总书记关于“四好农村路”作出重要批示五周
<正>前些天下校调研,听了一节名为"创意合成"的Photoshop课,看着学生们忙碌地找素材表达自己的创意,突然想起王竹立教授的设问——创新思维能教吗?创新思维能教吗?近两年多来
金属工件在加工过程中常会产生残余应力,残余应力的存在将会影响其尺寸稳定性、产生应力腐蚀和疲劳破坏,因此有必要消减工件内部的残余应力,减小疲劳因素的影响,使其更加安全
为解决采空区下工作面悬顶距离过长的问题,采用了现场观测、数值模拟、试验研究等手段,在分析采空区下坚硬顶板的矿压显现特征的基础上,提出了坚硬顶板控制技术。分析可知二2