论文部分内容阅读
随着全球信息化技术的快速发展,大数据作为我国重要的战略资源,推动着各个方面的快速发展。就统计学领域而言,因随机变量之间的条件独立性是大数据本身带有的重要信息,而传统的统计建模方法对变量之间的关系处理较简单,使得通过传统的建模方法不能高效的利用大数据。而起源于理论物理的图模型,它以直观化的方式描述变量之间的条件独立性关系,进而被越来越多的应用在大数据领域。高斯图模型作为特殊的一类图模型,它是在随机变量独立同分布于高斯分布的假设下,通过精度矩阵(协方差矩阵的逆矩阵)中的非零元素刻画相应变量之间的条件独立关系。然而现实生活中某些事件的相依关系是随着时间而变的,即上述假设中的同分布假设是不成立的,故从2010年起,时变高斯图模型就成了众多学者研究的热点。不管是高斯图模型还是时变高斯图模型,核心问题是如何估计出精度矩阵和给定时间下的精度矩阵,Tony Cai于2011使用CLIME(constrained l1-minimization for inverse matrix estimation)估计随机变量独立同分布下的精度矩阵,本文将使用该方法估计时变的精度矩阵,与Tony Cai所用的样本协方差矩阵不同的是:本文通过核函数作为样本协方差矩阵的核估计。即通过使用核函数刻画随机变量之间条件独立性的时变性,主要体现在给定时间t时,与t时间间隔越小的观测值的权重越大、间隔越大的观测值的权重越小。并且在真实的协方差矩阵满足一定的条件下,本文给出时间t下的精度矩阵与其在CLIME下的估计量在一定范数下的收敛速度,包括2范数、Frobenius范数和按元素l∞范数。本文的创新点在于使用方法CLIME估计时变高斯图模型,并给出精度矩阵与其估计量在一定范数下的收敛速度。