论文部分内容阅读
变点问题自上世纪70年代以来一直是统计学中的一个热门话题,目前它不但在工业质量控制中有广泛应用,而且在经济金融、气候和交通等领域也有大量的应用.本论文主要从非参数方法角度探讨独立随机序列的多变点问题及其在交通中的具体应用.多变点问题中两个重要的问题是变点个数的确定和变点位置的估计,本文运用两种非参数方法进行研究.首先,鉴于变点问题与两样本问题的内在联系,将变点存在性问题转化为两分布是否相同的Kolmogorov-Smirnov(K-S)检验,并采用“局部比较法”思想通过具体的滑动窗口法讨论变点存在性的假设检验问题和变点位置的估计.其次,对于多变点问题,主要通过二分法将其转化为单变点问题,实现变点个数及其位置的同时估计.最后,对于不同分布类型的变点问题进行Matlab模拟,并给出了多变点的一个应用,即讨论了贵阳市中心城区道路车流量数据的变点问题.接下来运用基于极大似然的非参数方法讨论多变点问题,分为变点个数已知和未知两种情形.由于任一随机变量都有一个分布函数,且分布函数能够反映样本的所有信息,故在变点个数已知的情形下,通过经验分布函数的似然函数最大化来估计变点位置,并给出估计量的相合性证明.在变点个数未知的情形下,BIC信息准则通过引入关于变点个数的惩罚项达到似然函数和变点个数间的均衡,最小化BIC从而达到变点个数和位置估计的目的,并对估计量的收敛性给出证明.最后,通过变点个数已知情形动态规划算法求解似然函数,并进行R模拟,说明方法的有效性;对于变点个数未知情形,文中进行了贵阳市省公安厅路口车流量变点实例分析,结果显示该方法相对于参数方法交通流数据变点研究更优.