【摘 要】
:
纵向数据是由每个个体变量在时间或者空间上多次测量的数据构成,纵向数据既有时间序列数据的特点,又有截面数据的特点。增长曲线模型(Growth curve model,GCM)是进行纵向数据分析的一类重要模型,现有文献关于增长曲线模型的研究通常有两个重要假定:(1)随机误差矩阵服从多元正态分布;(2)组别矩阵已知。然而,实际中这两个假定不一定能满足,本文放松以上两个假定条件,在误差矩阵服从多元权指数分
论文部分内容阅读
纵向数据是由每个个体变量在时间或者空间上多次测量的数据构成,纵向数据既有时间序列数据的特点,又有截面数据的特点。增长曲线模型(Growth curve model,GCM)是进行纵向数据分析的一类重要模型,现有文献关于增长曲线模型的研究通常有两个重要假定:(1)随机误差矩阵服从多元正态分布;(2)组别矩阵已知。然而,实际中这两个假定不一定能满足,本文放松以上两个假定条件,在误差矩阵服从多元权指数分布和组别矩阵未知的前提下,讨论了该增长曲线模型(我们称为混合增长曲线模型)的估计问题,并基于混合增长曲线模型和随机搜索方法研究纵向数据的聚类。一般的GCM有以上两个比较强的假设,本文放松以上两个假设,首先是将随机误差矩阵的分布从多元正态分布扩展到更一般的多元权指数分布,并研究了GCM下的参数估计问题;其次是将组别矩阵已知的假设推广到未知的情况,此时将该模型称为混合增长曲线模型,并在多元权指数分布假设下讨论了混合增长曲线模型的参数估计问题,推导出了未知参数的估计形式。本文主要推广了潘雅婷等(2020)和Pan等(2021)的关于混合增长曲线模型的工作,她们是基于混合增长曲线模型,在误差矩阵服从多元正态分布且协方差结构为特定形式下去分析纵向数据,并推导出了未知参数的估计公式。本文在此基础上,将误差矩阵的分布从多元正态分布推广到多元权指数分布,并在组别矩阵未知的情况下,讨论混合增长曲线模型的参数估计问题。因为组别矩阵可以实现对每个个体的组别控制,因此根据估计出的组别矩阵,可以进行纵向数据的聚类分析,从而把复杂的数据聚类问题简化为对分类参数的估计问题,为纵向数据的聚类分析提供了一个新的视角。混合增长曲线模型为纵向数据聚类分析提供了一个新思路和新方法,即根据组别矩阵的估计来对纵向数据进行分组(聚类),但该混合模型的参数估计比较复杂,针对这个问题,本文提出一种新的纵向数据聚类方法,即基于随机搜索的聚类方法。该方法首先给出了一个回归聚类的信息准则,并根据该准则构建一个基于观测数据组别矩阵的样本概率函数,使该样本概率函数取得最大值时的组别矩阵即为最优组别矩阵。当个体数n很大时,在全空间内搜索最优组别矩阵是很困难,甚至是不可能的。本文主要通过马尔可夫链蒙特卡洛方法来获得组别矩阵的一个遍历性样本,根据该样本得到最优的组别矩阵。具体做法如下,通过迭代回归和聚类,获得一个吉布斯抽样器,从信息准则诱导得出的样本概率函数中生成组别矩阵的马尔可夫样本,根据该组样本得到最优组别矩阵,这里我们采用经验BIC(e BIC)准则来确定最佳聚类。模拟分析和实际数据分析表明我们提出的基于混合增长曲线模型和基于随机搜索下的参数估计方法和聚类方法是有效的。总之,基于混合增长曲线模型和随机搜索方法研究纵向数据聚类,可将本文的主要研究内容归纳为以下三点:(1)多元权指数分布下混合增长曲线模型的参数估计;(2)基于混合增长曲线模型的纵向数据聚类分析;(3)基于混合增长曲线模型和随机搜索方法的纵向数据聚类分析。本文的研究贡献为三点:(1)拓展了一般增长曲线模型。把增长曲线模型中误差矩阵分布假设从多元正态分布推广到多元权指数分布,从分布的角度拓展了增长曲线模型,使增长曲线模型更具有一般性,适用性也更强;(2)基于混合增长曲线模型,根据组别矩阵的估计,对观测个体进行聚类,为纵向数据聚类分析提供了新思路;(3)基于混合增长曲线模型和吉布斯抽样方法,提出了基于随机搜索的纵向数据聚类方法。与全子集聚类方法相比,该方法效率高、速度快,克服了全子集聚类法因个体数n很大,导致搜索空间巨大从而无法计算的缺点。
其他文献
近年来社交网络的平台数量和用户规模在持续增加,但社交网络使用给用户带来了诸多负面体验,致使一些大型社交网络平台的用户使用率有所下降。因此,社交网络用户的使用行为及相关的用户体验成为产业界和学术界重点关注的问题。主动和被动使用是社交网络用户最常见的两种使用方式。社交网络用户的主动使用行为通常被视为社交网络平台发展和成功的基石,但是,用户通常会花费更多的时间被动浏览社交网络。社交网络用户的主动和被动使
本文的研究主要聚焦于20世纪前期的西方版画。通过对这一特定历史情境下西方图像印刷与复制的形态演变的梳理,分析其背后的版画创作逻辑,并以此推导版画创作在此截点下所形成的新的观念指向与核心价值,同时也期望以此为借鉴寻求当代版画何为之解答。文章分为四个部分,分别为问题的导入、现象的梳理、原因的分析以及观点的推出。笔者首先通过绪论出“版画如何成为艺术”这一问题并划定了讨论范围,而后在文章的前四章中通过先后
成年猪的消化道内定植着数量庞大、种类繁多的微生物菌群,在营养物质代谢、免疫应答和生长发育等生物学过程中发挥重要作用。大量研究证实肠道微生物能调控脂质的消化、吸收和代谢,影响宿主不同组织的脂质代谢过程,调控脂肪在肝脏、皮下和肌肉等组织的沉积。在生猪生产中,皮下脂肪(Subcutaneous adipose tissue,SAT)含量和肌内脂肪(Intramuscular fat,IMF)含量是影响猪
随着时代的发展,人类已经通过现代医学攻克了许多疾病,但当代人类健康依然面临许多重大疾病的威胁,例如传染病,癌症等。传染病是一种能够在人与人之间或人与动物之间通过病原体互相传播并广泛流行的疾病。全球非病毒性性传播传染病中传播最广泛的是阴道毛滴虫病,根据世界卫生组织报道每年约有1.7亿人感染阴道毛滴虫病。癌症是一种严重威胁当代人类健康的重大疾病,根据世界卫生组织报道2020年在全球范围内癌症造成约10
铝合金的回收与再生利用是汽车行业在不远的将来必须面对的现实,同级使用是再生铝合金追求的目标。然而,受再生铝合金熔炼工艺、专用润滑剂和专用成形加工工艺的制约,国产再生铝合金尚无法满足全工业环节的应用,我国工业中再生铝合金的使用率远低于全球平均,生产的再生铝合金大多只能降级使用。这些都是因为对再生铝合金板材冲压成形过程中的缺陷演变行为、冲压润滑机理以及冲压成形工艺研究的缺失。论文以6061-T6变形铝
中国书法作为中国文化的一个典型代表,对内承担着传承中华文明的责任,对外承担着传播中华文化,提高中国文化软实力的使命。中国书法文化除了在中国历史悠久,文化地位特殊以外,也在历史上的不同时期对外产生了不同的影响。本文从传播学的角度,分析了从古至今中国书法文化国际传播的不同模式并举实例,力图从宏观和微观上阐释不同传播模式的传播过程和特点,从而总结出各种传播模式的规律和经验,以便为今后的中国文化走出去提供
分类和聚类方法是机器学习的核心研究领域。针对向量型数据(每个数据点为一向量)的研究已经较为成熟。因此,在处理矩阵型数据(每个数据点为一矩阵)时,一种简单做法是先将矩阵型数据拉直为向量,再利用向量型分类和聚类方法进行处理。然而,拉直操作会破坏数据本身自然的矩阵结构。而且,拉直后的数据往往维数非常高,容易陷入“维数灾难”问题。因此,近年来,学者们提出不采用拉直,直接对矩阵型数据进行分类和聚类的矩阵型方
龙泉窑青瓷以其厚如凝脂,质如碧玉的釉质闻名遐迩,厚釉是其典型的特征,龙泉青瓷工艺的发展始终围绕着厚釉工艺技术的探索与实践。可以说,龙泉青瓷工艺发展的历史实质上是厚釉工艺技术发展的历史,而多层釉工艺技术是厚釉工艺技术的核心,是龙泉青瓷从厚胎厚釉向薄胎厚釉特征转变,使龙泉青瓷步入高峰,在材料美学上最大限度接近于“玉质”理想的关键技术。本文以多层釉结构的南宋龙泉青瓷为研究对象,在前辈学者研究成果的基础上
第三方资助在国际投资仲裁领域发展迅速,不仅为处于经济困境或意图分担风险的申请人提供了接近正义的机会,也降低了被申请人承担的仲裁风险。但由于第三方资助者是仲裁协议的非签署方,其参与可能对投资仲裁程序造成负面影响,国际仲裁界应对第三方资助进行相应规制。本文除引论与结论外,主要内容分为六章。第一章阐释第三方资助国际仲裁的基本内涵。本文中的第三方资助是指与纠纷当事方无直接利害关系的自然人或法人,通过为有资