论文部分内容阅读
在社交网络高速发展的今天,每天都会有大量的网络数据产生,对网络数据的研究也愈加丰富和深入。网络数据包括反映网络结构的数据和网络中节点的数据。研究网络数据可以帮助我们更好地分析个体间的关系,包括个体的关联关系和互相影响的方式等。大部分情况下,这些关系并不是一成不变,而是随着时间的推移也会发生变化。因此,研究动态网络,或者更广泛的纵向网络数据,成为近年来网络数据研究的热门方向。将网络数据应用到经典统计模型是常见的网络数据分析方式之一,比如将网络向量自回归模型。该模型从时间序列模型的角度,认为网络中的每个个体在某时刻的表现,不仅会受到其本身上一时刻的影响,还会受到网络中与其相连的其他个体的影响。该模型可以通过网络解释个体间相互影响的关系,但认为每个个体对其他个体的影响程度相同。于是,本博士论文考虑在个体效应存在的情况下对网络向量自回归模型进行统计推断。除了对经典模型的加强,动态网络的结构分析在网络数据分析中更为常见。一个网络通常可以通过矩阵形式来表示,学者们通过矩阵分解来探究网络内在的关系,而动态网络则可以表示为一个三阶张量的形式。自然而然地,通过张量分解来分析动态网络的方法也应运而生。本博士论文也分别考虑了通过probit函数来连接隐张量变量和网络的probit张量分解模型和probit混合张量分解模型。具体而言,本论文主要分为两大部分。第一部分基于网络向量自回归模型,以现有的统计理论和方法为基础,提出了带有个体效应的网络向量自回归模型,研究了参数的估计与性质。第二部分基于最新提出的probit张量分解模型,首先在估计部分加入了Fusion惩罚,以达到变点检测的效果,然后提出了probit混合张量分解模型,提高了原模型的估计效果。第一章主要介绍了本文的研究背景和研究意义、文献综述、研究内容以及文章的写作框架。第二章主要介绍了之后章节需要的基本概念和工具,包括网络的定义与表示,两种惩罚函数的定义和张量分解的几种形式。第三章主要研究了网络向量自回归模型。针对使用网络结构优化传统自回归模型的问题,本章提出了带有个体效应的网络向量自回归,认为网络中的节点在某时刻的表现受到几个因素的影响,分别为:不随时间变化的个体协变量,该节点自身上一个时刻的表现,与该节点相连的其他节点在上一时刻的表现。而由于节点对整个网络的影响大小不同,我们认为不同的节点对其他节点的表现不同,即每个个体都带有个体效应。针对这样带来的估计问题,本章使用凝聚惩罚的思想,认为相连个体具有相似的个体效应,对个体效应之差进行惩罚,从而得出个体效应与其他所有参数的估计。对于加入凝聚惩罚的估计结果,我们还给出了外样本的参数的估计方法,估计过程中调节参数的选择方法,以及在一些假设条件下,估计结果的理论性质。本章最后通过两个模拟实验验证了所提出的模型和估计结果的优越性和稳定性,并通过分析著名的国际间贸易的数据来展示所提方法的效果。第四章主要研究了probit张量分解模型,该模型本来是用于建立多重关系的网络结构,本章将其拓展到动态网络领域,认为动态的网络是建立在一个隐张量变量之上,通过probit函数进行连接,而通过张量分解,我们可以分析出动态网络不随时间变化的个体特征,和随时间变化的动态因子。结合2008年前后的金融危机期间股票间同涨同跌关系的数据,我们对probit张量分解模型中的隐因子矩阵使用fusion惩罚,找出网络结构发生变化的时间点。本章还通过模拟分别比较了加fusion惩罚和不加fusion惩罚对估计结果的影响。第五章还是研究了probit张量分解模型,考虑现实数据中存在可以观测到的因子,比如股票市场中经典的三因子模型可以提供关于市场信息的三个因子,我们提出了probit混合张量分解模型。该模型将原来的隐张量拆分为两部分,其中一部分如第四章完全不可观测,另一部分含有可观测的显因子矩阵。我们也提出了一个新EM算法来估计模型中的参数,并且通过模拟实验的对比发现新模型的估计效果具有较高的准确性。最后我们依然分析了金融危机期间股票同涨同跌的动态网络数据,得出了一些新的结论。在本文的第六章,我们对整个博士论文所提方法进行了总结并考虑了一些潜在的研究方向和需要改进的地方。