论文部分内容阅读
线性模型是一类简单且常见的参数回归模型,它以形式简单、可解释性强等优点而备受研究者青睐。同时,部分线性模型是一类极为重要的半参数回归模型。在线性模型的基础上,部分线性模型进一步增加了非参的部分。因此,部分线性模型不仅继承了线性模型易于解释的特点,而且保留了非参数回归模型的灵活性,同时还克服了非参数回归模型遭遇的“维数祸根”问题。本文主要研究线性与部分线性模型的变量选择及其应用问题。具体来说,研究内容包括以下四个部分。第二章研究了高维稀疏线性模型的非负估计与变量选择问题。基于自适应Elastic-net惩罚函数,我们提出了非负约束条件下的非负自适应Elastic-net估计。在合适的正则条件下,我们证明了所提估计的变量选择相合性和渐近正态性。其次,我们给出了所提估计的具体计算方法。最后,我们通过数值模拟和实例分析验证了所提方法在有限样本下的有效性。第三章进一步研究高维稀疏线性模型的非负估计与变量选择问题。为了改善非负凸惩罚方法的有偏性,我们基于MCP惩罚函数提出了非负约束条件下的非负MCP估计。相比其他方法,我们可以证明所提估计在更少的正则条件下具有Oracle性质。另外,为了求解所提估计的目标函数,我们提出了一种基于Difference Convex算法和Multiplicative Updates算法的复合算法。最后,数值模拟和实例分析的结果都验证了所提方法相比于其他方法的优越性。第四章研究了固定维部分线性模型的稳健估计与变量选择问题。为了克服响应变量和协变量中异常值的影响,我们将加权最小一乘回归与自适应Lasso惩罚函数相结合来实现线性部分参数的稳健估计与变量选择。其次,我们采用一种稳健的局部线性回归方法来估计非参部分的未知光滑函数。最后,我们通过数值模拟和实例分析检验了所提方法在有限样本下的表现。第五章研究了发散维部分线性模型的稳健估计与变量选择问题。为了在不同误差分布下同时实现稳健性和有效性,我们将众数回归的思想延伸到部分线性模型当中。我们证明了所提方法在数据含有异常值或误差服从厚尾分布时更加稳健,并且在无异常值或正态误差下与相应最小二乘方法的效率渐近相等。同时,借助SCAD惩罚函数,我们考虑了线性部分的变量选择问题。其次,我们讨论了最优的理论窗宽以及实际中选择窗宽的办法。此外,当协变量个数大于样本容量时,我们提出了一种两阶段的变量选择方法来处理高维数据。最后,我们通过数值模拟和实例分析进一步验证了所提方法的稳健性和有效性。