基于自适应弹性网回归模型的缺失值处理

来源 :厦门大学 | 被引量 : 0次 | 上传用户:mini8912
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据缺失是统计研究领域中普遍存在的问题。在本文中,我们扩展了Choi和Tibshirani(2013)提出的弹性网回归下的半正定方差方法,引入了自适应弹性网线性回归模型。我们尝试在自变量具有缺失值的自适应弹性网模型下,不采用缺失值插补程序而是直接通过设计无偏估计量对参数进行估计。首先我们得出在自变量缺失的情况下目标函数的无偏估计量,接着我们通过引入一个合适大小的L2正则化项来调整这个无偏估计量使其为凸,以实现在缺失值条件下快速对参数的估计。本文还与均值插补方法作比较,通过数值模拟计算每种方法的产生的均方误差(MSE),来比较两种方法对参数的估计效果。最后,我们还通过共享单车日租赁量数据集以及前列腺癌疾病数据集这两个案例数据来考察自适应弹性网模型下的半正定方差法在缺失值问题下的模型预测效果。
其他文献
近年来,电流诱导磁化翻转的磁随机存储器器件迅速占据了磁随机存储器研究的主导地位,研究重点之一就是如何有效降低诱导磁化翻转的临界极化电流。相关实验表明,采用高自旋极化的材料和具有垂直磁各向异性的磁结构均有利于降低诱导磁化翻转的临界极化电流。Co基Heusler合金因为具有大的自旋极化、阻尼小、居里温度高等特点,成为实现垂直磁各向异性的理想铁磁层代表,因此,本论文以具有典型的高自旋极化率的Co基Heu
深度神经网络由于尺寸过大难以在资源有限的嵌入式设备中部署,同时,其存在严重的冗余和过高的复杂度。因此,对深度神经网络进行高效的压缩和加速,十分具有研究价值。为了解决这一问题,本文提出了采用粒子群算法优化深度神经网络压缩。本文提出的深度神经网络压缩方法分为四步进行:第一步,对预训练模型使用基于稀疏度的剪枝方法,将其冗余的权值删除;第二步,使用K--means++方法对剪枝后的网络各层权值进行聚类,原
采用有机地球化学和无机地球化学相结合的方法,来研究柯坪冲断带下寒武统烃源岩的发育环境及其生烃潜力,从目前来看,研究相对较少。本文首先利用元素地球化学实验测试数据,从
随着我国经济的发展,国力的不断强盛,作为电子设备中关键要素的电子元器件必须要有更高的品质和更好的性能,国内的关键电子元器件大部分依赖进口,尽早实现电子元器件自主可控
合成孔径雷达(Synthetic Aperture Radar,SAR),因为不受气候与时间限制的工作特性,被广泛应用于军事和民用的许多领域,SAR图像自动目标识别(Automatic Target Recognition,AT
当前,新型城镇化建设、公共服务备受关注,对未来我国社会、人民的发展意义非凡,城镇化战略已上升为国家战略。伴随新型城镇化战略的实行,已有公共体育服务体系难以符合新型城镇化的发展,为了促进新型城镇化的快速变革,就必须要对目前的公共体育服务体系进行完善。体育是新型城镇化进程中公共服务系统的重要元素,应认清其在发展中的问题,深刻反省自己的发展思路调整好战略部署。目前我国有越来越多的学者关注公共服务,但是对
随着电子商务的迅猛发展,网络购物已经成为人们日常生活中不可或缺的一部分。但随着在线商品种类的逐渐增多和商品图像的海量增长,基于文本特征的商品检索系统由于文本标注的
制造业作为支撑国民经济第二产业的主导产业,其发展水平与质量直接体现了一个国家的生产力水平。近年来,我国制造业发展突飞猛进、势头大好,无论是在规模、技术上,还是成果层面上都取得了耀眼的成就,但是仍与德国、日本等发达国家存在一定差距,我国制造业在发展质量方面仍有不足。因此,为实现制造业强国,成为世界制造业发展质量一流国家的目标,推动制造业高质量发展就成为我国当前研究的重点。河北省作为我国重点发展战略—
多智能体系统包围控制在联合监控、联合打击、目标追踪、环境勘测等方面有着广泛的应用,引起了诸多学者的关注。多智能体系统的包围控制问题中,不仅要实现智能体整体上的协同运动,还需要通过对目标的包围运动,实现对目标的保护或打击等任务。多智能体系统包围控制问题的核心思想是通过对目标的探测和智能体个体间的信息交互,设计控制协议,使得多智能体系统接近目标并按照一定的包围结构对目标形成包围。在实际应用中,对目标的
ZrO2陶瓷材料可以在断裂过程中产生相变增韧效果,因而具有优异的力学性能,被广泛应用在各个领域。ZrO2陶瓷材料的力学性能很大程度上取决于t-ZrO2晶粒的尺寸和相变量,而晶粒