关于高维因子模型断点和分类的研究及其应用

来源 :东北师范大学 | 被引量 : 0次 | 上传用户：_STLer

【摘要】

：

随着互联网的广泛普及和信息技术的迅猛发展,高维数据已经广泛出现在自然科学和社会科学等领域中。在高维数据中,变量之间往往具有一定的相关性,如何刻画这种高维相关性的特

【作者】

：

段江涛

【出处】

：

东北师范大学

【发表日期】

：

2020年01期

【关键词】

：

高维因子模型拟最大似然法结构断点 PCA 组函数子空间聚类

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着互联网的广泛普及和信息技术的迅猛发展,高维数据已经广泛出现在自然科学和社会科学等领域中。在高维数据中,变量之间往往具有一定的相关性,如何刻画这种高维相关性的特征已经成为近年来的热点研究方向。高维因子模型是对高维数据进行建模的一种有效统计工具,它可以刻画多个变量之间的关系并且可以对数据进行降维,在统计学、计量经济学、社会学等诸多领域有着广泛的应用。在高维因子模型中,结构断点探测和因子的聚类成为近几年的热点研究课题,本文主要在这两个方向上进行了理论研究,提出了相应的估计算法,同时证明了估计量的统计性质,并利用实际数据进行实证分析。本文的主要研究内容和研究结论及其创新点概括如下:第一,为了探测高维因子模型中结构断点的位置,本文第三章利用拟最大似然法估计高维因子模型中的结构断点,该方法首次将结构断点与因子个数、伪因子个数建立起直接的联系,有效地解决了Bai et al.（2020）^[12]中提出的旋转不可识别性问题,并从理论上证明了拟最大似然估计量相应的统计性质,即在适当的条件下:（1）如果断点使得整个数据中伪因子个数大于断点之前或者断点之后真实的因子个数,抑或同时大于断点之前和断点之后真实的因子个数,则拟最大似然估计量具有一致性;（2）如果整个数据中伪因子个数同时等于断点前和断点后真实的因子个数,也就是只存在因子载荷的旋转变化,则拟最大似然估计量与真实的断点之差是有界的,并推导出该情况下拟最大似然估计量的极限分布。同时,本章通过Monte Carlo模拟验证了相关理论结果,并且和现有的几种估计方法进行了比较分析,结果显示拟最大似然法具有一定的优势。最后,本章用拟最大似然法去探测美国2001年12月到2013年1月的宏观经济数据集,结果显示结构断点为2007年7月,这意味着在次贷危机的早期,模型结构已经发生了变化。事实上,2007年7月美国房价的下跌,直接导致了证券抛售行为,进而降低了证券的价值,因此经济学家Mark Zandi写道,2007年7月的事件“可能是随后发生的金融市场动荡的最直接催化剂”。第二,相比已有算法,拟最大似然法的运算速度有明显提升。Bai et al.（2020）^[12]在计算过程中需要对每个可能的断点划分都使用主成分分析法（PCA）,这就增加了运算的复杂度,从而导致运算速度下降;而Ma和Su（2018）^[55]和Cheng et al.（2016）^[34]在计算过程中需要用到Lasso方法,这就导致运算速度更慢。相比而言,由于本章所提出的拟最大似然法在计算过程中对所有的样本只使用一次主成分分析法（PCA）进行估计,因此在计算速度方面具有一定的优势。本章最后还给出多断点逐次估计的具体算法。Monte Carlo模拟结果显示,在多断点情况下,与Baltagi et al.（2020）^[22]方法相比,本章提出的拟最大似然估计量依然表现良好。因此,对于时间维度非常大并且存在多个断点的大规模数据集中,拟最大似然法在运算速度和准确率方面都有一定的优势。因此,从这两方面来说,本章所提出的拟最大似然法具有很大的实际应用价值。第三,本文第四章将高维因子模型扩展至具有交互效应的面板数据模型,并且假设交互效应中的因子载荷部分具有子空间结构。在面板数据中,由于个体间存在异质性,因而对异质性进行聚类是一个非常重要的研究课题。本文将K-means聚类扩展至更一般的子空间聚类,提出了最小二乘子空间聚类算法并证明了其估计量的相关统计性质,该算法通过迭代对模型中的未知参数、因子载荷子空间和组函数进行求解。Monte Carlo模拟结果显示,和现有几种估计方法相比,最小二乘子空间聚类算法具有一定优势。本章还利用该方法对世界上90个国家在1970—2000年中的民主与收入之间的关系进行实证分析,结果显示,民主与收入之间存在正相关。最后,本章给出了一个对因子个数、子空间个数和子空间维数的一个可行的模型选择准则。

其他文献

基于机器视觉的城市道路交叉口交通参数提取及交通信号控制

中心城市在国家区域协调发展中发挥着越来越重要的作用,城市交通的管理和控制逐渐成为了制约城市建设和经济发展的主要问题之一。在城市人口不断增加,人们对交通出行方式和交

学位

图像处理智能交通系统目标检测目标跟踪相机标定交通信号控制

剩余污泥碱性发酵液碳回收及脱水能力改善策略的机制研究

利用厌氧发酵技术从剩余活性污泥（WAS）中回收挥发性脂肪酸（VFAs）,从而为生物脱氮工艺（BNR）提供碳源,该方法为剩余污泥的处理处置提供了一种具有经济效益和应用前景的技术手段。其中

学位

酸性发酵碱性发酵酸化氯化镁挥发性脂肪酸营养去除脱水性

城市道路典型交通失范行为特征及影响研究

近年来,我国城市居民的交通文明素养与城市交通建设发展水平之间依然存在一定差距,交通违规、违法行为和交通陋习等交通失范行为仍屡见不鲜。本论文依托于国家自然科学基金《

学位

交通失范行为交通效率交通安全管理对策

棉铃虫和亚洲玉米螟对性信息素的识别机制研究

性信息素对于昆虫的求偶和交配行为至关重要,对于鳞翅目昆虫,性信息素通常由雌虫释放,雄虫可以在远距离识别这些化学物质并通过其定位雌虫。由于性信息素高度物种专一和环保

学位

鳞翅目昆虫外周识别性信息素性信息素受体神经肽

基于移动激光雷达数据的路面状况检测方法研究

随着我国公路建设的迅速发展,对公路养护和旧路改扩建的需求迅速扩大。路面是公路养护及改扩建工作的核心内容,快速、有效掌握路面几何参数和公路路面技术状况及其变化趋势是

学位

移动激光扫描Tgrid结构路面点云公路几何线形路面技术状况

新时代提高国家文化软实力研究

国家文化软实力是综合国力的重要组成部分,系指一个国家通过政治制度的吸引力、文化价值的感召力和国家形象的亲和力等传递与表达出来的影响力。古往今来,任何一个大国的发展

学位

新时代国家文化软实力社会主义核心价值观

纳米微孔铝翅片的制备及其表面凝露结霜机理研究

空调系统的能耗对建筑节能具有重要意义,其广泛应用于夏季制冷除湿和冬季制热,空调系统的节能不仅可以降低建筑能耗,也符合低碳建筑的发展要求。研究表明:表面有微纳米结构的

学位

纳米微孔铝翅片表面性能凝露结霜机理模型

复合PVD氮化物刀具涂层的制备及其性能研究

表面涂层可有效减少刀具的切削磨损、提升加工效率以及加工质量,已成为金属切削领域的研究重点。作为一种典型的刀具涂层,AlTiN具有良好的硬度和热稳定性,已成功在工业上获得

学位

纳米多层涂层复合沉积技术摩擦学性能抗氧化性高速干式切削

GPS非构造垂直形变研究

自20世纪90年代以来,随着GPS技术的飞速发展,对国民经济生活和科学研究都有着巨大的影响。我国于“十一五”期间投资建设了国家重大科技基础设施“中国大陆构造环境监测网络

学位

GPS非构造垂直形变质量负荷热膨胀效应土层周期形变

维多利亚惊悚小说的伦理取向研究

伦理是人际关系的产物,伦理学是研究人的道德行为的学问,而文学伦理学批评则是伦理学视角下进行文学批评的方法。文学和伦理学对人的共同关注构成了两个学科的交叉点,并在此

学位

维多利亚惊悚小说伦理取向善恶评价和谐社会形式与内容的统一

关于高维因子模型断点和分类的研究及其应用

其他学术论文