代谢组学数据中系统性因素校正的新方法

来源 :厦门大学 | 被引量 : 0次 | 上传用户:wuhaoxust
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
代谢组学是定量考察生命体系对内外界刺激、或者基因修饰的代谢应答规律。在探究某一特定刺激因素对代谢系统的影响时,若存在不感兴趣因素,且这些因素对代谢系统的影响是系统性的(Systematic),则将使得数据难于分析,影响分析结果的准确性。因此,对不感兴趣的系统性因素进行校正是一个重要的研究课题。本文做了以下两个方面的工作:一、提出基于聚类的不感兴趣残差滤除方法(CURE)。CURE算法首先对数据矩阵进行ANOVA分解,保留数据的整体均值矩阵和研究因素矩阵,然后对归一化后的数据矩阵进行聚类分析得到所有系统因素影响的分布情况,随后将分类样本的类间均值从归一化数据中滤除得到“干净”的残差矩阵,最后将该残差矩阵重新加回总体均值矩阵和研究因素矩阵得到校正后的数据。将该算法和基于ANOVA的方法、正交信号校正、Climaco-Pinto等人的方法(CPF)进行比较,结果表明该方法能有效的校正系统性因素的影响并且保持较低的过拟合风险。二、联合生化数据对代谢组学数据中的系统性因素进行校正。基于OSC的联合校正新方法首先借助OSC将代谢组学数据矩阵分成与因变量矩阵(Y)平行和与因变量(Y)垂直的两部分,然后将与Y垂直部分的信息投影到生化数据空间,重新保留与生化数据平行的代谢组学数据信息。将生物个体的生化数据用于代谢组学数据的系统性因素校正,通过多平台数据融合的方式,从生物信息角度进一步改善校正方法对于数据的作用。真实的肝病数据分析结果表明,该方法能有效的校正系统性因素的干扰,增强疾病因素的显著性,提高多元统计分析模型的预测能力和解释能力。同时,模型的置换检验结果显示该校正方法具有较强的稳定性。本文研究为代谢组学数据中系统性因素的校正提供了新的方法,两种方法都能有效的减少系统性因素的影响,提高后续统计分析的准确性,突出数据中的生物信息差异。
其他文献
和谐的师生关系是班级一切工作顺利开展的保障。而周记在和谐师生关系中的作用妙不可言。它是洞察学生心灵世界的窗口,是师生情感交流的纽带,是促进师生自我成长的平台,班主
中国正处于经济转型时期,粗放式的经济发展模式导致企业存在不同程度的组织冗余。另外,在国家“大众创业,万众创新”的号召下,吸引了大量创业爱好者的同时中国创业企业的失败率也惊人的高。现有文献对组织冗余与企业创新和绩效的关系进行了大量研究,但已有研究并没有对组织冗余和创业失败之间的关系进行探讨。对此,本文对组织冗余与创业失败之间的关系进行实证研究,探讨不同类型的冗余资源对创业失败可能造成的影响,并加入创
本研究依托英语语料库,在语用化理论视域下,探究语用标记语‘’frankly’’的演变。在厘清语用化和语法化之争的基础上,通过甄别‘’frankly"的不同语用功能,描写"frankly"在
随着市场经济的快速发展、知识经济的出现和经济全球化的加速,企业面临着日益激烈和复杂的竞争环境。首先,要想在这种环境下立于不败之地,企业就必须建立健全科学有效的绩效考核管理体系。其次,企业的绩效考核与每个员工的切身利益密切相关。因此,需要一系列的改进策略和实施方案,以提高绩效管理的科学性、实用性、合理性,进而提高公司管理的各个方面,从而促进公司核心竞争力的快速提升。本文的研究对象是XB证券公司一般员
目的分析马来酸桂哌齐特注射液相关皮肤类的药品不良反应(ADR)与过敏样反应/过敏性休克的可靠发生率及发生特征,为临床提供参考资料。方法设置"医疗机构药品不良事件(ADE)主
水稻黄单胞菌栖稻致病变种(Xanthomonas oryzae pv. oryzicola,Xoc),俗称水稻条斑病菌是水稻重要的细菌性病原物之一,能侵染水稻产生细菌性条斑病(bacterial leaf streak,BLS),造成水稻严重减产。Xoc主要通过叶片的气孔和伤口侵染水稻,并定殖在叶肉组织的质外体,导致脉间失绿,形成失绿条斑。至今尚未在水稻中发现抗BLS的主效抗病基因,亟待发展有效的
本研究以英语专业一到四年级学生议论文中词汇丰富性特征的描写为基础,目的是寻求学生词汇丰富性发展规律,丰富和拓展词汇使用情况研究。本研究词汇丰富性的操作定义围绕词汇
互联网技术的飞速发展和通信网络带宽与速度的不断提升,随之而来的是新闻数量的激增及新闻类型的多样化,同时也在一定程度上影响了新闻内容的质量,致使用户在获取自己关心的
近年来,无线通信技术的发展十分迅猛,这使得有限的频谱资源变得日益紧缺,因此对频谱资源进行有效的管理将会对无线通信技术今后的发展产生深远影响。在非合作通信中,接收方缺乏发射方的相关信息,但又需要对信号的种类进行有效识别和参数估计;在民用通信中,为了更好的利用频谱资源,也需要对频谱进行检测,以便能够快速获得可用的频谱。这需要对信号的调制参数进行估计,但现有的估计技术大多建立在奈奎斯特速率上,带来了很大
海洋考古在我国考古史上长期缺失,游离在公众视野之外。随着考古理念的转变,研究重心开始转向公众考古。作为考古学科的重要分支,海洋考古自然也迎来了研究的契机。此次翻译