基于几种马尔可夫过程对过分散计数数据相依结构的研究

来源 :山东大学 | 被引量 : 0次 | 上传用户:yangliang0510
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
过分散计数数据是指具有方差大于均值特性的一类非负离散整数型数值,刻画了在固定时间段内某行为的发生次数,广泛存在于各应用和科学领域。对于过分散计数数据的研究,主流方法是使用负二项分布对其进行分析,但在现实生活中计数数据往往是多维的,且存在多重相依结构,可总结为时间相依性、空间联动性和变量相关性三种情况,常用的统计模型已经不能满足此类数据研究的需要。倘若忽视数据的过分散性或相依结构则可能会降低模型的准确性,甚至得到错误的决策。因此,从过分散计数数据本身具有的变量相关性、时间相依性和空间联动性三个角度出发,建立过分散计数数据专属模型预期会在参数推断和分类精度方面均有较大的提升。马尔可夫过程是一类用于描述时间序列的经典随机过程可以很好地刻画变量在时间上的依赖关系。隐马尔可夫模型和耦合隐马尔可夫模型均是马尔可夫过程中经典的应用模型,分别可以对时间序列和具有时间-空间结构的数据进行建模。本课题将从统计建模、参数估计和实际应用三部分着手对过分散计数数据的时间相依性、空间联动性和变量相关性进行分析。(1)在统计建模上,本文选取几种经典的马尔可夫过程和负二项分布以及多元泊松对数正态分布来拟合计数数据时间上、空间中、变量间的三种相依结构,其中马尔可夫链可对时间结构进行建模,马氏链间的耦合关系可对空间结构进行拟合,条件输出分布则可对变量间的关系进行考察。(2)在参数估计上,本文采用较前沿的期望最大化算法、虚拟似然函数、变分推断以及贝叶斯抽样等技术解决由模型复杂性产生的统计和计算问题。针对模型不同的结构特点,本文提出变分虚拟似然期望最大化算法和蒙特卡洛期望最大化算法分别对基于负二项分布的耦合隐马尔可夫模型和基于多元泊松对数正态分布的隐马尔可夫模型进行参数点估计。(3)在实际应用上,将提出的两种模型应用到空气污染领域中,通过充分分析空气污染数据具有的各种相依结构以便对空气质量状态进行准确的分类和预测,从而有助于在空气污染的联防联治、区域共治提供理论支撑的同时帮助人们合理规划外出安排,减少空气污染的暴露。
其他文献
金融科技是金融与信息技术融合发展的成果,在金融业内应用广泛,给传统的商业银行,带来机遇的同时,也带来了挑战。为了分析金融科技对商业银行全要素生产率的作用机理,本文基于信息不对称、技术溢出和颠覆性创新理论,依照金融科技影响商业银行投入产出进而影响其全要素生产率的路径,从成本、收益、竞争、风险四方面进行分析。为研究金融科技对商业银行全要素生产率的影响,本文以BankFocus数据库中176家中国商业银
学位
《小说界》1981年由上海文艺出版社创办,是新时期文学的产物。上海为其提供了丰富的文化资源和地区经验,作为都市文化的一张名片,刊物也致力于地域文学的建构和对于海派风格的多样化诠释,既促进了都市文学的发展,也推动了自身的革新。本文通过“都市文学视野”这一重要线索,串联起《小说界》四十余年的办刊历程,分析其成功经验和不足之处,以期为当下文学期刊的发展提供一定的借鉴。第一章首先分析海派文化与都市文学的关
学位
本文主要考虑将有限维矩阵代数中的经典Smiley定理推广至复Hilbert空间上的算子代数中.本文通过剖析经典Smiley定理的证明思想,应用算子代数和李代数理论,主要证明了对于复Hilbert空间中具有局部幂零根基的谱算子是(k,l)-型Smiley算子.更准确地来说,对于复Hilbert空间中的任一具有局部幂零根基的谱算子A和任意两个正整数l,k(l ≥k),如果一个有界算子B属于有界算子X的
学位
在本篇论文中,我们主要研究了带无界生成元的一般情形的平均场超前倒向随机微分方程,此时方程的系数不仅依赖于解和解的超前项,也依赖于它们的联合分布。我们的研究内容分为三部分。首先,在第三章中,我们考虑了如下超前倒向随机微分方程:其中s+δ(s),s+ζ(s)≤T+K。对任意的s∈[0,T],g(s,ω,y,z,ξ,η):Ω ×Rm ×Rm×d × L2(Fr,Rm)×L2(Fr,Rm×d)→L2(Fs
学位
随着我国经济及综合实力的进步,人民消费理念和保险理念显著增强,社会保险和商业保险快速发展,公民同时投保工伤险、交强险、意外伤害险的情形越来越多,职工因工受交通意外伤害时上述三种保险同时触发的情形也越来越多。但我国法律对于该情形下三险赔付请求权冲突如何处理没有规定,现行中国法律规范中规定人身保险合同项下的保险金理赔不适用损失补偿的原则,这一国家立法制度现状似乎又与目前实际生活场景中投保人对健康保险、
学位
癌症是危害人类身体健康的疾病之一,且成为我国第三大死亡原因。研究发现慢性炎症与癌症的发生、发展及抗癌治疗的疗效密切相关。宿主内的持续感染诱发慢性炎症,反复的组织损伤和组织再生导致永久性的基因组改变。因此,开发选择性高的抗癌药物和活性高的抗炎药物以改善癌症治疗的疗效,仍然是当前重要科学问题之一。大黄素和大黄酸是广泛存在于中草药植物中的蒽醌类化合物,被证明具有抗癌和抗炎活性。但其水溶性较差,生物利用率
学位
恒星大气物理参数(有效温度Teff、表面重力logg、金属丰度[Fe/H])以及元素丰度([C/Fe]、[Mg/Fe]、[N/Fe])对于研究银河系结构和演化以及星系的组成等至关重要。随着世界各国的大型望远镜相继投入巡天,天文学家可以获取海量的测光数据与光谱数据。如何从这些观测数据中准确测量恒星参数(恒星大气物理参数与元素丰度)是天文学家最为关心的问题。随着机器学习技术的发展与人工智能的进步,使用
学位
GC含量一直是分子系统学研究的重要参数,是基因组重要组成特征之一,在不同物种间、基因组间和基因组内不同区域的GC含量差异显著。这种差异产生的原因一般是由于在进化过程中更倾向于增加rDNA的GC含量,这个过程被称为偏向GC的基因转换(gBGC)。gBGC理论通常用于解释哺乳动物和酵母菌基因组GC含量的变化,但在植物界中仅在禾本科植物中得到验证,其普遍性尚未证实。有关gBGC的研究目前未能与RNA特有
学位
人体随着年龄的增长在逐渐衰老的过程中,大脑是最先开始衰老的器官之一。大脑在生理性衰老过程中,结构和功能会发生一系列变化。在某些内部和外部因素的共同作用下,大脑会从生理性衰老逐渐转变为病理性衰老,最终导致了神经退行性疾病的发生。当前,人们对神经退行性疾病的发生机制仍然不是很清楚,临床上的治疗手段有限。目前,普遍认为衰老是神经退行性疾病的最大风险因素,因此,针对衰老制定的保护策略可能会成为抑制神经退行
学位
圆法(又称δ-恒等式)是研究解析数论问题常用的重要方法.圆法的形式多种多样,采用不同形式的圆法对所研究的问题有重要影响.本文令g是Γ0(D)上的本原全纯或Maass新形式.通过研究与g有关的Bessel积分,我们推导出与g有关的Besselδ-恒等式的渐近展开.这是对圆法形式的创新.作为应用我们证明了下述混合亚凸界,即对于任意的ε>0,L(1/2+it,g(?)χ)<<g,ε(q(1+|t|)εq
学位