论文部分内容阅读
随着大数据时代的不断发展,线性模型的应用更加普遍,广义线性模型因而就突显出它很大的优势,具有更大的发展前景和研究价值。广义线性模型在统计分析中是一个非常重要且应用比较广泛的模型。它是对线性模型的一种推广,它的因变量只需要服从指数族分布,这使得它对多种类型的数据都可以进行建模或者拟合。这里因变量不仅包含连续型变量,而且包含离散型变量,除此之外还有较大偏度分布的变量以及对称变量。与此同时,它还可以通过连接函数将因变量与自变量之间的非线性关系转化为线性关系,从而能够更加方便地处理因变量与自变量之间复杂的非线性关系。因此本文基于广义线性模型来研究惩罚似然函数的调节参数选择。近些年来,人们越来越关注使用惩罚似然函数的思想不断地进行变量选择和对未知参数的估计。变量选择是处理高维统计模型的基本方法。在回归模型的变量选择中,SCAD是一种很好的惩罚函数,之所以这么说主要是因为SCAD惩罚函数具有oracle性质,除此之外该惩罚函数不光可以选择出正确的模型,而且能够对模型选择后的参数进行较好的估计。但是为了在回归分析中应用惩罚似然函数,研究者将面临两大挑战。第一个难点就是非凹惩罚似然估计的计算问题。这个问题在近年的一些文献中有详细的研究,例如局部二次逼近算法(LQA)和最小角回归算法(LARS)等,除此之外,在局部线性逼近算法(LLA)的帮助下,还可采用LARS算法来解决非凹惩罚似然函数的优化问题。然而以上的计算过程严重取决于调节参数的正确选择。因此,该参数的选择将是研究者们要面临的第二大挑战,也是该论文的主要部分。上面提到的SCAD惩罚具有的这些良好性质是有前提条件的,那就是尽可能地选择出一个合适的调节参数。只有在调节参数的选择恰当的情况下,SCAD惩罚才能得到很好地估计结果。本文研究了广义线性模型基于SCAD惩罚函数使用ERIC方法进行调节参数的选择,并且证明了在一定条件下,经过该准则选择的模型具有一致性。试验模拟和实证分析表明:ERIC方法在选择调节参数方面比其他传统的CV方法、AIC方法等更具有良好的表现,结果也支持了该准则的理论性质。