论文部分内容阅读
极值理论是统计学中一个重要的分支,专门研究那些很少发生,但是一旦发生却具有重大影响的随机事件。近年来,极值理论在很多领域都有应用,尤其极值理论与VaR的结合在金融领域中应用得非常广泛,然而极值理论在对自然灾害研究这一块很少涉及到。而近年来,自然灾害频繁发生,其造成的损失也极为惨重。因此,对极端自然灾害的频率分析具有重要意义。极值理论主要有两种常用的模型:BMM模型和POT模型。BMM模型主要是对区组的最大值建模,可以用来分析区组(例如年、季度、月)的最大值的统计规律;POT模型则是将所有超过给定门限值的所有观测值作为观测样本,然后对其超出量建模。这两种模型其关键的问题在于极值模型中门限值的确定及参数的估计,本文对于门限值的选择和参数的估计作了重点的研究。然而,极值事件的特点是频率低、损失大,因此数据缺乏会导致参数估计的结果可信度不高。因此,在极值理论的基础上,文中又使用贝叶斯估计和基于Gibbs抽样的MCMC方法来估计‘GPD模型中的参数,从而避免了极值数据不足时极大似然估计所带来的误差过大的问题。本文遵循从理论研究到实证分析的研究路径。本文内容主要分为三个部分,如下:第一部分介绍了在极值型定理和广义极值分布的形式,给出区间极值模型的参数及高分位数的估计,并就临澧和石门站点的年最大流量数据进行建模,计算出超出概率以及重现期为50年和100年的重现水平。第二部分介绍广义Pareto分布,对GPD分布中门限值的初步确定以及参数的估计作了详尽的探讨,同时使用GPD模型的检验方法确定最合适的门限值,并使用桃江和津市的日站点流量数据进行建模,计算出站点流量超过某一给定流量的概率值。第三部分探讨了贝叶斯统计在参数估计中的应用。文中介绍了贝叶斯理论和MCMC方法的基本原理,以及一种比较特殊的MCMC算法—Gibbs抽样,并基于MCMC方法使用openbugs软件估计出GPD模型中的参数,并与其他方法得到的参数估计值加以对比。