论文部分内容阅读
线性混合模型已经成为一类重要的统计模型,近年来,线性混合模型在各个领域得到了越来越广泛的应用。并且线性混合模型已被应用到多种多样的数据类型上。随着信息时代的发展,以数据为中心的传统科学的研究,例如基因组学、蛋白组学、脑科学等,产生了越来越多的大数据,线性混合模型也被越来越多的统计学家应用到了这种大型的基因数据与蛋白质质谱数据上。
本文为了解决在普通配置的计算机上,对于具有大型瘦长型设计矩阵的线性混合模型的参数估计问题。在FaST-LMM方法的思想基础上,通过推广用来求解dominant奇异子空间的方法,结合核外计算的思想得到了两种新的方法来求大型瘦长型矩阵的奇异值分解,即面向列分块的R-SVD方法,面向行分块SVD方法,并给出了这两种方法的并行算法的实现方法。将它们与FaST-LMM方法结合就可以在普通计算机上求得大数据线性混合模型的参数估计,本文在R中分别对这两种方法给出了模拟。
为了能够将FaST-LMM方法应用到黑色素瘤质谱数据的分析上,本文还介绍了针对大型分块对角稀疏矩阵的SVD计算方法,并在R中实现了数据分析的过程。
通过论文的研究工作,得出了一些有价值的规律和结论。