基于线性混合模型对大型数据的统计分析方法及其应用

来源 :西南交通大学 | 被引量 : 0次 | 上传用户:chlo16105
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
线性混合模型已经成为一类重要的统计模型,近年来,线性混合模型在各个领域得到了越来越广泛的应用。并且线性混合模型已被应用到多种多样的数据类型上。随着信息时代的发展,以数据为中心的传统科学的研究,例如基因组学、蛋白组学、脑科学等,产生了越来越多的大数据,线性混合模型也被越来越多的统计学家应用到了这种大型的基因数据与蛋白质质谱数据上。   本文为了解决在普通配置的计算机上,对于具有大型瘦长型设计矩阵的线性混合模型的参数估计问题。在FaST-LMM方法的思想基础上,通过推广用来求解dominant奇异子空间的方法,结合核外计算的思想得到了两种新的方法来求大型瘦长型矩阵的奇异值分解,即面向列分块的R-SVD方法,面向行分块SVD方法,并给出了这两种方法的并行算法的实现方法。将它们与FaST-LMM方法结合就可以在普通计算机上求得大数据线性混合模型的参数估计,本文在R中分别对这两种方法给出了模拟。   为了能够将FaST-LMM方法应用到黑色素瘤质谱数据的分析上,本文还介绍了针对大型分块对角稀疏矩阵的SVD计算方法,并在R中实现了数据分析的过程。   通过论文的研究工作,得出了一些有价值的规律和结论。
其他文献
本文介绍了一类特殊的自仿射集,我们称为McMullen集.在文中,我们首先介绍McMullen利用概率论的方法来计算它的Hausdorff维数和盒维数,然后我们又介绍了Peres通过密度定理对这一
文章给出了用复杂可编程逻辑器件 (CPLD)实现离散事件动态系统 (DEDS)监控器的方法 首先用Petri网中的条件 /事件系统 (C/E系统 )对DEDS建模 ,然后使用Petri网工具对模型进
期刊
The major challenge in printable electronics fabrication is to effectively and accurately control a drop-on-demand (DoD) inkjet printhead for high printing qual
图论的产生和发展经历了二百多年的历史,它是组合数学的一个重要分支.  本文所涉及的图均指无向简单有限图,我们把不含环和重边的无向有限图称为简单图,无爪图是简单图中的一
图像处理旨在突出图像中的部分细节信息,以便于人眼的视觉观察和计算机后续分析操作.在雾霾环境条件下,由于大气粒子的作用,户外图像的能见度受到限制且图像的对比度有所下降
海洋平台是在海上开发油气资源的重要技术装备,长期处在海洋环境中会受到地震、波浪、风以及冰等多种环境载荷的耦合作用,而且由于平台自身结构特性会产生自激波浪力,这都将会使平台发生振动。因此,研究经济、可靠的减振控制方法以提高海洋平台系统的稳定性,对改善平台作业人员的工作环境和保证机械设备的正常运行有着极其重要的理论和实际价值。本文对海洋平台减振控制方法的研究主要基于时滞非脆弱控制和鲁棒H_∞控制两种方
本文研究了在二维空间中完全可压的Navier-Stokes方程的爆破准则.在证明过程中,我们主要采用了反证法和能量方法,最终得到了基于密度的上下界以及温度可积性的爆破准则.    
本文利用广义凹凸算子的不动点定理,研究了几类微分方程解的存在唯一性,推广和改进了相关文献的结果,全文共分为四章.   第一章简要介绍了本文所研究问题的背景及现状,同时对
本文主要研究特征为零的代数闭域上具有交换理想和交换子代数的n-李代数,记α(L)为n-李代数L的交换子代数的最大维数,β(L)为n-李代数L的交换理想的最大维数,研究了一般n-李代数
本论文在前人工作的基础上,对树的子树个数问题做了仔细深入研究,具体内容包括:   论文的第一章介绍了该篇论文的研究背景、研究意义,以及国内外学者对于这方面的研究状况.通