若干新型降维方法及其在变量筛选和因果推断中的应用

来源 :华东师范大学 | 被引量 : 0次 | 上传用户:feileizuhe
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
生物学、计量经济学、信号处理等领域数据采集技术的快速发展,对传统的多元分析提出了巨大的挑战。高维数据分析变得无处不在。降维,尤其是充分降维,为解决高维数据问题提供了一条有效的途径。通常是要找到协变量的一些线性组合来达到降维的目的。当协变量可以自然的分组为X和W,并且我们只关心对X部分进行降维时,部分降维就出现了。我们提出了一些新的充分降维和部分降维方法,并将充分降维应用到因果推断中。本文的主要内容如下:(1)部分降维是一个相当普遍的问题,但是当W连续时,只有很少的方法可以用。当X和W相关时,这些方法都表现不好,而且没有一种方法可以估计X的低维子空间可以随着W变化的情况。因此,我们提出了基于辅助变量的部分降维,并将经典的充分降维方法改编成这种基于辅助变量的部分降维。同时,我们还研究了这种基于辅助变量的部分降维的渐近相合性。大量的数值研究和实际数据表明,基于辅助变量的部分降维有着良好的表现。(2)鞅差散度度量了两个随机向量的条件(均值)独立性。我们提出了一种基于Lévy测度的广义鞅差散度(及其相关系数)来检测这种独立性。而且,我们应用广义鞅差相关系数作为边际效用来做高维变量筛选。模拟和实例分析验证了我们所提出的方法的良好性能。(3)我们对两种流行的充分降维方法进行了综述,包括切片逆回归(SIR)和主海塞方向(PHD)。除此之外,我们采用了条件特征函数求导的方法,并开发了一系列新的无切片的方法,分别称为加权逆回归集成(WIRE)和加权主海塞方向(WPHD)。同时揭示了其与最近发展的鞅差散度矩阵(MDDM)和波动鞅差散度矩阵(VMDDM)的关系。在样本水平,我们表明WIRE和WPHD方法的样本估计量是(?)相合的,并且使用ladle方法来确定中心子空间的维数。大量的数值研究表明,我们提出的无切片方法优于SIR和PHD。(4)子总体的平均因果效应(CATE)是用来捕获子总体的治疗效果的异质性。在可忽略假设下,用基于结果回归的方法估计CATE。我们分别提出了在真实、参数、非参数和半参数结构下的基于结果回归的CATE估计量并推导它们的渐近线性表达和渐近正态性。根据渐近方差函数,我们得出了这四种估计量的渐近效率排序。此外,我们还研究了带宽和核函数对于提高渐近效率有什么作用以及哪些情况下应使用半参数的CATE。最重要的是,任何基于回归的CATE都比任何基于倾向得分的CATE渐近更有效。
其他文献
近年来,安全博弈模型已经广泛应用于城市基础设施、野生动植物保护以及网络安全等领域。安保部门的最优决策可通过求解博弈模型的均衡解得到。然而,复杂的现实生活场景往往需要建立为不同形式的安全博弈模型,从而求解不同形式的均衡解。为了研究不同场景安全博弈中的均衡解,使其适用于解决更多现实场景中的安保部门资源分配问题,具体地,本文做了如下工作:(1)研究了单防御者vs单攻击者安全博弈场景中的强斯塔克尔伯格均衡
不规则任务指分解、映射以及运行过程中,在数据分割、流程控制、内存访问等方面表现出不规则性质的任务。不规则任务在并行平台上执行时,会引发控制流程分歧、负载不均衡、数据访问局部性差等问题,导致系统资源利用率下降。为了追求高性能和低成本,大量不规则任务需要在CPU-GPU异构平台上运行。因此研究不规则任务在CPU-GPU平台上的实现及优化,有着现实意义和价值。本文研究了动态计算量和数据划分不均匀类型的不
磷酸二氢钾(KDP)晶体凭借其优异的电光特性及非线性光学性能,成为能源和国防等领域高端装备中的关键光学材料,其作用和地位无可替代。然而,KDP晶体具有易潮解、脆性大、硬度低、强各向异性等一系列难加工特性,给其超精密加工带来了极大的挑战,而传统机械加工存在的亚表面损伤,严重制约了其激光损伤阈值这一关键使役性能指标的提升。探索KDP晶体的近无损伤超精密加工新技术,成为国内外专家学者研究的热点之一,而作
人脸特征点检测是计算机视觉领域的关键问题,其旨在自动地定位一系列具有特定语义的面部特征点。高效准确的人脸特征点检测是执行人脸识别、三维面部重建、情绪感知、头部姿态估计等多种人脸分析任务的前提。近年来,人脸特征点检测得到了国内外学者的广泛研究,取得了大量的成果。级联回归凭借出众的精度与速度成为目前人脸特征点检测性能最好的方法之一。大量提出的方法对于约束条件下采集的正脸图像表现出优异的性能。然而在实际
近十年来,随着虚拟试衣,个性化服装定制,身体健康监控系统等应用需求的快速增长,简单、高效的三维人体数字化表示技术受到科研人员越来越多的关注。传统的基于大型激光扫描仪的三维人体重建技术为三维人体数字化表示提供了有力的数据保障,方兴未艾的机器学习技术特别是深度学习技术则为三维人体数字化表示提供了新的理论和算法工具。大致来说,三维人体数字化表示涉及以下内容的研究与应用:数据预处理、人体形状表示空间以及高
在高速无粘可压缩流动中,广泛存在着一种十分重要的物理现象——激波。当气流跨过激波时一些主要的流动参数将发生显著突变,对整个流场特性往往会造成很大影响。在认识激波传播及其相互作用现象的过程中,数值模拟是一个非常有效的手段。目前,主要有两类截然不同的方法用以处理流场中的激波:激波捕捉法和激波装配法。激波捕捉法在全流场统一求解流动控制方程,无需特殊处理便能自动捕捉到激波,因该方法自动化程度很高,目前已经
金属有机骨架(Metal-organicframework,MOF)因其超高的孔隙率,可调控的孔道结构和内表面性质成为良好的膜分离材料之一。MOF膜的微观结构优化是提升其气体分离性能的关键。其中,MOF膜的取向调控有望在减少晶间界缺陷的同时,提升孔道的有序度同时缩短扩散路径,对气体分离性能具有重要影响。而MOF膜的取向调控目前仍然面临诸多挑战。二次生长法通过预沉积的晶种层可以克服在多孔载体表面异相
各类高强度、高硬度、高塑性的金属材料,在航空、航天、军工等领域应用广泛,且应用中对加工精度的要求越来越高;但这些金属材料的切削加工性能较差,属于典型的难加工材料。大气压冷等离子体射流通过改善切削区冷却润滑环境,可有效降低切削力,提高刀具寿命和表面质量。但现有研究中,冷等离子体射流对切削界面浸润性的调控效率较低;另外,目前尚未揭示冷等离子体射流对切削区刀-工材料的作用机理,导致难以确定应用于辅助加工
基于自旋轨道电子转移系间窜越(SOCT ISC)机理的D-A(电子给受体)二元化合物(dyad)是一类新型的无重原子三重态光敏剂,具有合成方法简单、生物毒性低、三重态寿命长等优点,在光子上转换、光催化、人工光合作用、光动力治疗等领域具有潜在的应用价值。但目前对该类三重态光敏剂的报道较少,ISC效率与电子给受体结构、分子构型等的关系尚不明确。因此,新型电子给受体三重态光敏剂分子的设计,及对其激发态等
托卡马克是目前最有希望实现聚变能的发电装置之一,聚变反应的燃料是氢同位素氘和氚。氚具有放射性且价格昂贵,为了保证核聚变的安全性和经济性,需要控制托卡马克器壁材料中氚的滞留量,国际热核聚变实验堆(ITER)要求氚的滞留量控制在700克以下。因此,如何控制托卡马克器壁中氚的滞留是需要解决的一个重要问题。钨因具有熔点高、导热系数高、溅射产率低、氚滞留率低等优点而成为最有前景的托卡马克的面向等离子体器壁材