缺失数据下的降维方法与降维模型研究

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:zylalazy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着科学技术的进步与发展,一方面数据的收集与存储变得越来越容易,另一方面数据类型的多样性与复杂性也给数据分析工作者带来了巨大的挑战。可能高维的缺失数据就是这样一类复杂数据,在很多实际问题中经常遇到,比如在民意测验、市场调查、生物医学研究等领域尤为常见。这类数据的分析与建模必然呈现出“双重“的困难,即不仅要求处理好数据缺失问题,还要求解决好维数祸根问题。基于这两点考虑,本文致力于研究缺失数据下的充分降维方法与降维模型的兴趣参数估计问题。首先,提出了一种基于降维的核插补方法来处理协变量随机缺失下的充分降维问题,并证明了所得到的中心子空间的估计是根号n相合的。其次,当响应变量遭遇不可忽略缺失时,在一个相对灵活的半参数不可忽略缺失机制下,一方面提出了三种估计方程方法,即逆概率加权型估计方程、回归插补型估计方程以及扩张的逆概率加权型估计方程,来获得降维方向的估计,并证明了所提出的三种估计是相合的且渐近正态分布的,另一方面也研究了作为经典降维模型的部分线性单指标模型的估计问题,提出了一族具有“双稳健性”的插补估计方程来获得兴趣参数的估计,并证明了所提出估计的相合性和渐近正态性。也执行了大量的数值模拟来评估所提出的这些方法的有限样本表现。
其他文献
本文致力于研究两类非线性偏微分方程含小参数时解的存在性、多解性和集中性的分析刻画。具体地,关于非线性Kirchhoff型方程我们考虑了位势中含有局部极大或者鞍点时解的存在
Talagrand于1996年首先在欧氏空间上对Gauss测度建立了运费不等式.从那以后,在这个方向有了许多工作.本文的主要目的是考虑在一些无穷维空间上建立运费不等式.在取值于非紧李
带有平衡约束的数学规划问题(MPEC)是含有参数变分不等式约束的数学规划问题。由于它的广泛应用和它与运筹学的其他分支的紧密联系,这个非凸的,非光滑的难于解决的问题吸引了越
本文研究了在线Dial-a-Ride问题,考虑了目标函数是最大完工时间的多服务器问题和目标函数是总流水时间的单服务器问题。得到了一些结果。 在第二章中,研究了在线多服务器问
证券市场复杂性研究是复杂性科学研究的非常活跃的领域。随着经济体制和金融体制改革的深入,作为市场经济重要特征的证券市场已经成为我国社会生活的一个重要组成部分。而且证
学位
最优化问题广泛见于经济计划,工程设计,生产管理,交通运输,国防等重要领域.近年来,最优化问题的规模越来越大,因而研究高效的优化问题的计算方法具有重要意义.本文研究三类最优化问
在第一章中,我们给出这篇论文的综述.我们主要研究四个问题:Sobolev不等式与Φ-熵下的指数收敛性,一维扩散半群在Wasserstein度量W1下的指数收敛性,图上的Ricci曲率下界和马氏过
二十一世纪的大数据时代中,各个领域涌现的大规模优化问题对传统的优化算法是一个巨大的挑战,稀疏优化逐渐成为研究的热点之一.稀疏优化中非凸稀疏恢复问题的稳定恢复误差界依
证券市场有效性是证券市场研究中的基础和核心问题,许多重要问题的解决都依赖于对市场效率和运作机制的深入分析。金融经济学家们进行了大量的研究,以检验金融市场的有效性。虽