纵向社交网络数据的统计建模与估计

来源 :上海财经大学 | 被引量 : 0次 | 上传用户:seanstarseanstar
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在社交网络高速发展的今天,每天都会有大量的网络数据产生,对网络数据的研究也愈加丰富和深入。网络数据包括反映网络结构的数据和网络中节点的数据。研究网络数据可以帮助我们更好地分析个体间的关系,包括个体的关联关系和互相影响的方式等。大部分情况下,这些关系并不是一成不变,而是随着时间的推移也会发生变化。因此,研究动态网络,或者更广泛的纵向网络数据,成为近年来网络数据研究的热门方向。将网络数据应用到经典统计模型是常见的网络数据分析方式之一,比如将网络向量自回归模型。该模型从时间序列模型的角度,认为网络中的每个个体在某时刻的表现,不仅会受到其本身上一时刻的影响,还会受到网络中与其相连的其他个体的影响。该模型可以通过网络解释个体间相互影响的关系,但认为每个个体对其他个体的影响程度相同。于是,本博士论文考虑在个体效应存在的情况下对网络向量自回归模型进行统计推断。除了对经典模型的加强,动态网络的结构分析在网络数据分析中更为常见。一个网络通常可以通过矩阵形式来表示,学者们通过矩阵分解来探究网络内在的关系,而动态网络则可以表示为一个三阶张量的形式。自然而然地,通过张量分解来分析动态网络的方法也应运而生。本博士论文也分别考虑了通过probit函数来连接隐张量变量和网络的probit张量分解模型和probit混合张量分解模型。具体而言,本论文主要分为两大部分。第一部分基于网络向量自回归模型,以现有的统计理论和方法为基础,提出了带有个体效应的网络向量自回归模型,研究了参数的估计与性质。第二部分基于最新提出的probit张量分解模型,首先在估计部分加入了Fusion惩罚,以达到变点检测的效果,然后提出了probit混合张量分解模型,提高了原模型的估计效果。第一章主要介绍了本文的研究背景和研究意义、文献综述、研究内容以及文章的写作框架。第二章主要介绍了之后章节需要的基本概念和工具,包括网络的定义与表示,两种惩罚函数的定义和张量分解的几种形式。第三章主要研究了网络向量自回归模型。针对使用网络结构优化传统自回归模型的问题,本章提出了带有个体效应的网络向量自回归,认为网络中的节点在某时刻的表现受到几个因素的影响,分别为:不随时间变化的个体协变量,该节点自身上一个时刻的表现,与该节点相连的其他节点在上一时刻的表现。而由于节点对整个网络的影响大小不同,我们认为不同的节点对其他节点的表现不同,即每个个体都带有个体效应。针对这样带来的估计问题,本章使用凝聚惩罚的思想,认为相连个体具有相似的个体效应,对个体效应之差进行惩罚,从而得出个体效应与其他所有参数的估计。对于加入凝聚惩罚的估计结果,我们还给出了外样本的参数的估计方法,估计过程中调节参数的选择方法,以及在一些假设条件下,估计结果的理论性质。本章最后通过两个模拟实验验证了所提出的模型和估计结果的优越性和稳定性,并通过分析著名的国际间贸易的数据来展示所提方法的效果。第四章主要研究了probit张量分解模型,该模型本来是用于建立多重关系的网络结构,本章将其拓展到动态网络领域,认为动态的网络是建立在一个隐张量变量之上,通过probit函数进行连接,而通过张量分解,我们可以分析出动态网络不随时间变化的个体特征,和随时间变化的动态因子。结合2008年前后的金融危机期间股票间同涨同跌关系的数据,我们对probit张量分解模型中的隐因子矩阵使用fusion惩罚,找出网络结构发生变化的时间点。本章还通过模拟分别比较了加fusion惩罚和不加fusion惩罚对估计结果的影响。第五章还是研究了probit张量分解模型,考虑现实数据中存在可以观测到的因子,比如股票市场中经典的三因子模型可以提供关于市场信息的三个因子,我们提出了probit混合张量分解模型。该模型将原来的隐张量拆分为两部分,其中一部分如第四章完全不可观测,另一部分含有可观测的显因子矩阵。我们也提出了一个新EM算法来估计模型中的参数,并且通过模拟实验的对比发现新模型的估计效果具有较高的准确性。最后我们依然分析了金融危机期间股票同涨同跌的动态网络数据,得出了一些新的结论。在本文的第六章,我们对整个博士论文所提方法进行了总结并考虑了一些潜在的研究方向和需要改进的地方。
其他文献
广州管圆线虫(Angiostrongylus cantonesis,A.cantonesis),又称为大鼠肺线虫,由我国著名寄生虫学家陈心陶教授于1935年在广州家鼠体内首次发现和命名。自1945年在我国台湾省发现了该虫的首例人体感染病例以来,迄今为止,全球已报告确诊或疑似病例约3000余例。以往,广州管圆线虫病流行于东南亚、太平洋岛屿地区,但近年来在北美、南美、非洲和澳大利亚陆续出现该病的病例报
背景:世界卫生组织在2001年颁布了《国际功能、残疾和健康分类》(The International Classification of Functioning,Disability and Health,ICF),为临床上功能评估提供了全面、标准的构架和语言。ICF通用组合是可用于不同健康状况人群及不同医疗机构的最小组合。本研究旨在验证ICF通用组合在临床应用中的如下指标:1)评估者间信度;2)
胃癌是世界范围内的常见恶性肿瘤之一,中国所在的东亚地区尤为高发。最新癌症数据显示,中国的胃癌发病率和死亡率均已上升至第二位。胃癌患者临床表现早期症状、体征不明显,同时又缺乏特异性的敏感初筛指标,大部分患者初次确诊时已处于中晚期不可手术切除。相对于乳腺癌、非小细胞肺癌、结直肠癌治疗近年来所取得的巨大进展,晚期胃癌全身化疗和靶向治疗的中位生存期仍维持在1年左右,至今没有取得疗效和生存时间的大幅度突破。
学位
学位
改革开放以来,中国民营企业,特别是农民创业企业,实现了从无到有,由弱变强的跨越式发展,书写出一篇篇留世佳作。企业的价值创造,离不开其治理体系的支撑,并且一直以来,绝大多数中国民营企业由农民创业者组成,属于宗族共治模式,也就是说,由宗族核心成员掌控企业的发展战略,形成了以血缘关系为纽带的精神、物质资源分配方式,逐渐发展成一系列有别于西方企业的独特治理模式(潘越等,2019)。现有文献多从正式制度的视
经历了2020年新冠肺炎疫情后,中小企业纷纷裁员甚至倒闭,失业人群超出想象。多个重要城市出台地摊经济相关指导措施,落实保民生、稳就业、促发展。但地摊经济也带来环境卫生、交通堵塞、社会治安等一系列问题。本文从准公共物品、外部效应、消费替代效应、政府职能理论等方面分析地摊经济带来的利弊,提出通过规范经营行为,加强技术指导和监督管理,因地制宜、科学布局,谨防“搭便车”行为,缓解地摊经济带来的负外部性,同
剩余寿命是指在个体已经活过某段时间的前提下,该个体还能继续存活多久,即其剩余寿命还有多长时间.剩余寿命问题在生物医学及金融领域中经常遇到.在医学临床试验中,剩余寿命通常是病人们最关心的量,尤其对于那些患慢性疾病或不可治愈疾病(如癌症)的病人,他们想知道某种治疗是否可以延长自己的寿命.另一方面,医生也需要知道这些疾病是如何发展的,所采取的治疗方案是否有效,以及应用新的治疗方法是否就能延长病人的寿命等
甘蔗(Saccharum spp.)是最重要的糖料作物,占世界食糖总产的80%,占我国的90%以上。甘蔗起源于热带,经长期驯化主要在亚热带地区种植,新植和宿根发株均在冬末春初,期间以低温或低温与阴雨相伴天气为主,此时甘蔗正处于未萌动芽、萌动芽、芽苗或幼苗期,除未萌动芽外,均易受低温危害。研究甘蔗耐寒机制,挖掘冷响应基因,不仅对揭示植物耐寒性机理具有科学意义,对促进培育耐寒性甘蔗品种也具有重要的现实
嗜水气单胞菌Aeromonas hydrophila是在全世界范围内流行的一种条件致病菌,给水产养殖业和人类健康带来了严重危害。抗生素是防治嗜水气单胞菌的主要手段,在我国每年投入多于5000吨的四环素类抗生素(包括了土霉素、四环素和金霉素等)用于养殖业中。土霉素因其效果好、毒性小、代谢快等特点直接作为鱼药添加剂加入饲料中。大量的耐土霉素菌株的产生大大降低了它的作用效果,在开发新药成本越来越高的情况