论文部分内容阅读
本文针对极值分布和医学图像分析中若干统计推断问题,进行了理论研究和实际数据应用分析。对于极值分布,所讨论的统计推断问题主要可分为三类:一类是一元广义极值分布的统计推断问题,即参数估计及其假设检验问题;第二类是多元极值Copula的非参数统计推断问题;第三类是二元近极值事件态密度的统计推断问题。从统计学意义上讲,极值事件是小概率事件。然而,这类事件一旦发生,影响巨大。极值分布包括一元和多元极值分布,它主要是对观测到的基于某个样本量的极值建立的统计模型。同时,另一个与极值分布同样具有重要研究意义的对象就是近极值事件态密度,它从一定意义上来说是一种评估风险的指标。对于医学图像分析而言,本文主要考虑了基于坐标的医学图像平面形态数据的高维聚类分析。形态分析已经成为了一个十分重要的研究问题。最近的十年里,它在计算机视觉,目标识别,医学图像分析等领域都有着广泛的应用。形态分析早期的许多工作都是基于坐标点,目标的形态通过目标边界的离散采样点来进行表示。形态分析里面一个重要的研究目标就是基于研究目标的边界的形态对目标进行聚类分析。 本文首先引入了基于最大间距损失函数的参数估计方法,并将它与Box-Cox变换相结合,针对一元广义极值分布提出了一种改进的最大间距估计方法.其次,为了分析一元广义极值分布中形态参数的假设检验问题,本文基于L。似然函数和改进的最大间距损失函数,分别构造出了两种新的检验统计量。接着,针对多元极值分布,本文基于Picakands相依函数,研究了极值Copula的非参数估计方法及在实际数据分析中的应用。然后,本文引入了二元近极值态密度的概念,并将现有的一维近极值事件态密度理论推广到了多维的情形。最后,本文构造了一种惩罚型的混合offset-normal形态因子分析(MOSFA)模型来对平面高维形态数据进行聚类分析。 第二章研究了一元广义极值分布的参数估计问题。首先引入了基于最大间距损失函数的参数估计方法,并将它与Box-Cox变换相结合,提出了一种改进的最大间距估计方法;其次利用内点罚函数优化算法和bootstrap方法,解决了新的估计方法在具体的算法设计上的问题;接着讨论了新的参数估计的渐近相合性和渐近正态性,并通过模拟仿真研究了新的估计方法的有限样本下的性质;最后基于改进的最大间距估计方法,分别实证分析了标准普尔500指数周收盘价数据和电子元件寿命数据,并将分析结果与现有方法得到的结果进行了比较。 第三章研究了一元广义极值分布形态参数的假设检验问题。首先基于Lq似然函数和改进的最大间距损失函数,分别构造出了两种新的检验统计量:Lq似然比检验统计量和间距比检验统计量;其次讨论了两者检验统计量在原假设下的渐近性质,推导了间距比检验统计量的局部渐近功效函数;接着通过模拟验证检验统计量的有限样本性质和大样本性质;最后基于两种新的检验统计量,分别实证分析了道琼斯指数收盘价数据和丹麦火灾保险理赔数据。 第四章研究了多元极值Copula的非参数估计问题。首先引入了Pickands相依函数的概念,基于联系函数的思想,提出了一种针对Pickands相依函数的非参数估计方法。由于Pickands相依函数是多元极值Copula的核心部分,继而给出了一种针对多元极值Copula的非参数估计方法。其次利用最小二乘和投影近似的技术对提出的非参数估计方法进行了进一步的改进,同时讨论了联系函数的最优选取问题;接着基于经验过程理论研究新的非参数估计的弱收敛的性质,同时通过模拟验证了新的估计方法的有限样本性质;最后基于新的非参数估计方法,实证分析了三种货币(欧元、英镑、加元)汇率的月最大负对数报酬数据的相依关系。 第五章研究了针对金融数据的二元近极值态密度的统计推断问题。首先构造了二元近极值态密度的表达式,并基于一元极值分布理论和多元极值Copula理论,推导二元近极值平均态密度的近似形式;其次基于新的一元广义极值分布的参数统计推断方法和多元极值分布的非参数估计方法,讨论了二元近极值平均态密度的估计问题,并通过模拟仿真验证了二元近极值平均态密度的大样本下的近似结果;最后基于二元近极值平均态密度,实证分析了欧元和英镑汇率的月最大负对数报酬数据的相依关系。 第六章构造了一种惩罚型的混合offset-normal形态因子分析(MOSFA)模型来对平面高维形态数据进行聚类分析。MOSFA模型的提出了解决了四个主要的难点,包括形态数据属于曲线形态空间;高维的特征空间;时刻相关结构的存在;形态数据与部分协变量(例如性别、年龄)相关。同时还结合ADMM方法,构造了一种EM算法来计算参数的MPLE。并通过数值模拟仿真研究MOSFA模型的有限样本下的性质;最后基于ADHD200的CC形态数据,我们应用MOSFA模型对形态数据进行聚类分析,并将分析结果与现有方法得到的结果进行比较。 综上所述,本文系统地研究了一元广义极值分布的参数估计问题,一元广义极值分布形态参数的假设检验问题,多元极值Copula的非参数估计问题,二元近极值态密度的统计推断问题,以及基于坐标的医学图像平面形态数据的高维聚类分析问题。得到了丰富的研究成果。这些研究成果不仅具有重要的理论价值也具有广泛的实际应用价值。