论文部分内容阅读
在计数模型的分析探究中,经常会遇到计数资料间存在较大的差异。当变量的方差大于期望时,便存在过离散现象。由于大量零值的存在而造成期望与方差之间的差异,便是零膨胀现象。针对上述数据的处理,目前通常是选择符合实际情况的离散分布模型与零膨胀结构相结合的方式,构造出适当零膨胀离散分布模型来处理此问题。由于零膨胀结构对于过零值现象的显著效果,现今的零膨胀泊松分布模型、零膨胀负二项分布模型及其推广形式,广泛应用于工业、农业、保险、环境科学、森林火灾、交通事故控制等领域。上述结构模型的关注重点在于对过零值现象的分析处理,对所研究对象的数据分布探讨的并不充分。首先,对本文所研究对象的数据分布特点,进行全面深刻地分析,发现研究对象仅存在两种互斥结果,此时具备典型的二项分布特点。但随着对研究对象的数据分布的进一步分析时,发现所研究对象的数据分布中期望小于方差值,那么就不满足二项分布中期望大于方差的前提条件。因此,本文选择以传统的二项分布模型为基础,将其扩展到更为一般的形式,通过引入全局散度构造出改进二项分布模型,使其不仅能满足数据结构中期望小于方差的特性又符合二项分布的特点。其次,本文所研究对象中,存在过零值现象。本文选择引入零膨胀结构与上述构造的改进的二项分布相结合,构造出改进的零膨胀二项分布模型,使其能较好地解决在环境超标排放数据过程中,既能处理存在过零值问题又能解决期望小于方差的问题。随后以极大似然估计与牛顿迭代法求解,得到最优全局调节散度,以增加其应用范围。最后,基于一组实际研究的排放数据进行实证分析,使用AIC、BIC来检验构造模型的拟合优度,对模型拟合优度结果进行交叉验证。实验结果表明,改进的零膨胀二项分布可取得较好的拟合效果,其AIC、BIC以及LR值均小于零膨胀二项分布。表明改进分布模型在适应性与鲁棒性上均较强,具有现实意义与理论价值。