论文部分内容阅读
时间序列是研究相依数据的重要工具,时间序列分析是统计学的一个主要分支,相关的理论方法和实践应用一直是国际前沿和热点问题.传统的时间序列模型处理的主要是连续型数据,建模整值数据的效果并不好,而整值数据在日常生活和生产实践中广泛存在,例如:某传染病每日新增的确诊人数,保险公司每个月的理赔次数等等,因此,整值时间序列的建模和统计推断应运而生,成为备受人们关注的研究方向和探索领域.本文的主要内容分为三个部分.首先,我们考虑一类一阶广义随机系数整值时间序列模型,采用经验似然统计法讨论了参数的点估计、置信域和假设检验等问题.其次,我们考虑一类一阶随机系数混合整值自回归模型,给出了参数的两步最小二乘估计方法,建立了估计量的大样本性质,并且基于此讨论了稀疏参数的随机性假设检验问题.最后,我们考虑一类二阶随机系数整值自回归模型,研究了参数的估计方法和模型是否为二阶的假设检验问题.下面具体介绍本文的统计模型和主要结果.1.广义随机系数INAR(1)模型的经验似然推断为了使得整值时间序列模型灵活多变,应用广泛,Gomes et al.(2009)提出了一类广义随机系数INAR(1)模型.定义1若过程{Xt,t∈N}满足如下递归方程:Xt=φt(?)G Xt-1+εt,t ∈ N,则称{Xt,t ∈ N}为GRCINAR(1)模型,其中(ⅰ){φ,t≥1}为取正值的i.i.d.随机变量序列,其均值和方差分别记为φ=E(φt)和σ12=Var(φt).分布函数记为Pφ1.(ⅱ){εt,t≥1}为取非负整值的i.i.d.随机变量序列,其均值和方差分别记为λ=E(εt)和σ22=Var(εt).概率分布列为fe.(ⅲ广义算子φt(?)G Xt—1的定义为:(?)t(?)G Xt-1|φt Xt-1~G(φtXt-1.δtXt-1).这里G(φtXt-1,δtXt-1)表示一个离散型随机变量的分布,其均值为φtXt-1,方差为δtXt-1.(ⅳ)X0、{φt≥ 1}和{εt,t ≥ 1}相互独立.Gomes et al.(2009)给出了模型参数的条件最小一二乘和条件极大似然估计方法,我们主要考虑它们的经验似然推断方法.记θ=(φ,λ)T,易知其对数经验似然比统计量为#12其中#12 b(θ)满足#12我们可以得到对数经验似然比统计量的渐近分布.定理1如果{Xt,t∈N}是严平稳遍历的,且E(Xt4)<+∞,那么(?),n→+∝.根据上述定理,可以基于经验似然法构造参数的置信域.定理2如果{Xt,t ∈N}是严平稳遍历的,且E(Xt4)<+∞,那么参数θ的置信水平为100(1-α)%的置信域为:Cα,nEL={θ|l(θ)≤cα},其中0<α<1,cα满足P(x2(2)≥cα)=α.另一方面,θ的极大经验似然估计可以通过极小化lE(θ)得到,即#12其中#12下列定理给出了θMEL的渐近性质.定理3如果{Xt,t∈N}是严平稳遍历的,且E(Xt4)<+∞,那么参数θ的极大经验似然估计θMEL是相合的,并且有(?)(θMEL-θ0)(?)N(0,V-1W(θ0)V-1),n→+∞,其中θ0为θ的真值,#12#12在实际应用中,我们有时还会考虑参数θ的假设检验问题:H0:θ=θ00 v.s.H1:θ≠θ0.基于经验似然方法.我们可以构造如下经验似然比统计量:Q(θ)=l(θ)-l(gMEL).且可以得到它的极限分布:定理4如果{Xt,t ∈ N}是严平稳遍历的,且E(Xt4)<+∞.在原假设H0成立的条件下,我们有Q(θ0)(?)λ2(2),n→+∞.由此,可以构造显著性水平为α的拒绝域为Wn,α={Q(θ0)≥ cα},其中cα满足P(X2(2)≥cα)=α.2.随机系数混合INAR(1)模型的统计推断为了克服经典混合INAR(1)模型稀疏参数为常数的局限.我们提出一类随机系数混合INAR(1)模型.定义2称满足如下递归关系的过程{Xt.t ∈ N}为RCMINAR(1))模型:#12其中“(?)”和“*”分别表示二项稀疏算子和负二项稀疏算子,并假设(ⅰ){φt,t≥1}为取值在(0,1)上的i.i.d.随机变量序列,其分布函数记为Pφ1,均值和方差分别为φ=E(φt)和σ12=Var(φt);(ⅱ){εt,t ≥ 1}为取非负整值的i.i.d.随机变量序列,其概率分布列记为fε,均值和方差分别为λ=E(εt)和σ=Var(εt);(ⅲ)X0、{φt,t≥ 1}和{εt,t≥1}相互独立.(ⅳ)对任意固定的t和s(t≠s),εt与{Bi(t-l),i≥1}和{Wi(t-l),i≥1}(l≥0)都独立,且{Bi(t),i≥1}与{Bj(s),j≥1}独立,{Wi(t),i≥1}与{Wj(s),j≥1}也独立(ⅴ)对于任意t,s≥ 1,给定φt,{Bi(t),i≥1}与{Wi(t),i≥1}独立.我们首先得到了模型存在唯一严平稳遍历解的条件.定理5如果0<σ12+φ2<1,那么RCMINAR(1)模型{Xt,t∈N}存在唯一的严平稳遍历解.接下来,我们讨论模型参数的估计问题.对于η=(φ,λ)T,我们有#12其中Yt=(Xt-1,1)T.为了估计θ=(σ12,p,σ22)T,我们采用两步最小二乘估计法.记δ=(σ12,(1-2p)(σ12+φ2)+φ,σ22T,Zt=(Xt21,Xt1,1)T,可得δ的估计为#12注意到δ是η的函数,记为δ(η).把η的最小二乘估计代入上式,得到δ(η),从而可以给出θ的最小二乘估计为θ1=σ12=δ1(η),θ2=p=1/2-δ2(η)-η1/2(δ1(η)+η12,θ3=σ22=δ3(η),其中,θ1、θ2θ3与δ1(η)、δ2(η)和δ3(η)别是θ与δ(η)的三个分量,η1是η的第一个分量.下列定理给出了估计量的大样本性质.定理6如果{Xt,t∈N}是严平稳遍历的,且E(Xt8)<+∝,那么(?),n→+∞.协方差矩阵为#12其中V=E(YtYtT),Φ=E[(Xt-YtTη0)2YtYtT],U=E(ZtZtT),Δ=E[(VZ-trδ0)2ZtZtT],Π=E[(Vt-ZtTδ0)(Xt-YtTη0)ZtYtT].定理7如果{Xt,t∈N}是严平稳遍历的,且E(Xt8)<+∞.那么(?),n→+∞,其中#12最后,我们研究了如下假设检验问题:H0:σ12=0 v.s.H1:σ12>0.令e=(0,0,1,0,0)T,那么可以构造检验统计量并得到它的渐近分布如下:(?),n→+∞.基于此,我们可以得到显著性水平为α的拒绝域为#12其中uα/2为标准正态分布的上α/2分位数,Ω是Ω的相合估计.3.一类随机系数INAR(2)模型的统计推断在稀疏参数为常数的INAR(2)模型基础上我们建立一类随机系数INAR(2)模型.定义3称满足如下递归关系的过程{Xt,t∈N}为BRCINAR(2)模型;#12其中,稀疏参数α1,α2 ∈(0,1)是常数,{εt}是均值为λ,方差为σε2非负整值i.i.d.随机变量序列,并且与{Xt-1}独立.我们首先得到了模型存在唯一严平稳遍历解的条件.定理8假设α1,α2 ∈(0,1)和p1,p2 ∈(0,1),那么BRCINAR(2)模型{Xt}存在唯一的严平稳遍历解.接下来,我们利用两步最小二乘法估计模型的未知参数.记η=(β1,β2,λ)T,其中β1=p1α1,β2=p2α2,那么η=M-1b,其中#12#12令0=(α1β1-β12,α2β2-β22,β1-α1β1,β2-α2β2,2β1β2,σε2)T,那么#12其中Vt=Xt-β1Xt1-β2Xt1-λ,Zt=(Xt21,Xt-22,Xt-1,Xt-2,-Xt-1Xt-2,1)T.把η的估计代入θ(η),得到的结果记为θ(η),则可以解得α1,α2,p1,p2的估计为α1=θ1(η)+η12/η1,α2=θ2(η)+η22/η2,p1=η12/θ1(η)+η12,p2=η22/θ2(η)+η22,其中.η1.η2和θ1(η).θ2(η)分别为η和θ(η)的分量.下列定理给出了估计量的渐近性质.定理9 假设(Xt)是严平稳遍历过程,并且E|Xt|8<+∞,那么(?),n→+∞,协方差矩阵为#12其中#12Γ=EZtZtT.W=E((Vt-ZtTθ)2ZtZtT),Π=E((Vt-ZtTθ)(Xt-ηTDt)ZtDtT),Dt=(Xt-1,Xt-2,1)T,定理10 假设{Xt}是严平稳遍历过程,并且E|Xt|8<+∞,那么α1,α2,p1和p2分别是参数α1,α2,p1和p2的相合估计,且(?)(α1-α1,α2-α2,β1-β1,β2-β2)T(?)N(0,ΦΩΦT),其中#12最后,我们研究如下假设检验问题:H0:α2==0 vs.H1:α2>0.我们构造检验统计量(?)(α2-α2)/γ.其中γ=β22ω22+(β22-θ2)2ω88+2β2(β22-θ2)ω28/β24.这里ω22、ω28和ω88分别是Ω对应位置元素的相合估计.可以证明,检验统计量的渐近分布为标准正态分布.基于此,不难获得假设检验问题的拒绝域.