论文部分内容阅读
半参数可加风险模型和半参数变系数可加风险模型的变量选择与系数估计是统计理论研究中的热点研究内容,经典线性回归模型估计时往往对于样本个数和变量维数有一定的约束,因此本文将尝试在常系数模型设定下对高维数据进行数据模拟。针对半参数可加风险模型的变量选择与系数估计,主要是在惩罚函数正则估计的框架下,利用惩罚函数Lasso、SCAD、MCP方法来对模型进行数值模拟,并对具体实施算法循环坐标下降算法CCD进行分析研究;针对半参数变系数可加风险模型的变量选择与系数估计,则是在惩罚函数正则估计和样条逼近的框架下,利用惩罚函数group Lasso、group SCAD、group MCP对模型进行数值模拟,并对具体实施算法组循环坐标下降算法GCD进行分析研究。结果显示:(1)在半参数常系数可加风险模型的变量选择与系数估计过程中,惩罚函数MCP在预测能力、精确性、一致性等方面均表现最好;在低维设定下,当变量维数相对于变量个数变大时,Lasso、SCAD、MCP的表现能力变差;在高维设定下,随着变量维数的增加以及协变量之间相关系数的增大,三种惩罚函数的表现能力均有所下降;(2)在半参数变系数可加风险模型的变量选择与系数估计过程中,惩罚函数group MCP则在预测能力、精确性、一致性等方面均表现最好,同时在样本量较高或协变量相关程度较低的情形下,group Lasso、group SCAD、group MCP在预测、精确性和一致性方面均表现更优。