论文部分内容阅读
众所周知,矩阵是数据的二维表达,为数据的收集和处理带来了极大的便宜。对于多因子样本(指每个样本点的分量个数大于2)的情形,传统处理方法是通过“数据折叠”或者数据降维来实现矩阵表示,从而可进一步通过线性方程组或者最小二乘等方法实现问题的求解或参数的估计。但是“数据折叠”一定程度上破坏了数据的原始结构,而数据降维则可能造成有用信息的不必要的损失,使得最终的结果可能毫无意义,数据的张量表述可以克服这两个缺点。 张量是矩阵的高阶推广,可用于表达高维数据,并且有着类似于矩阵的性质和分解方法。本文介绍张量的Tucker分解,可视为矩阵奇异值分解在高阶情形下的推广,类似于矩阵的奇异值分解,一个3阶张量的Tucker分解是将其分解成一个核心张量(类似于矩阵的标准型)和三个不同方向上的正交矩阵的乘积。这种分解可以直接提取不同方向上的主成分。目前,包括MATLAB等计算软件已经嵌入Tucker分解工具包。 论文研究内容是:首先,基于两步估计对线性混合效应模型自变量的有效性进行检验并做进一步改进,即通过矩阵奇异值分解对线性混合效应模型进行变换,以消除随机项的影响,将模型转化成传统的线性回归模型,进而对模型自变量的有效性进行检验;其次,首次把张量概念引入到线性混合效应模型中,基于张量定义构建平衡线性混合效应模型的张量表达形式,进而基于张量Tucker分解对固定效应参数估计进行改进。当自变量间存在复共线性问题时,相较于矩阵奇异值分解,张量Tucker分解从更多的维度对数据进行挖掘,一方面剔除了更多的无关信息,得到更有用的信息,另一方面实现了对数据进一步的压缩,压缩了数据所占存储空间。