基于双侧截断数据的参数估计与数据重构

来源 :南京信息工程大学 | 被引量 : 0次 | 上传用户:hnsushiheng
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
双侧截断数据指受客观条件所限导致样本只有落在一定区间才可被观测的数据类型,这类数据常出现在天文观测,计量经济与生存分析领域。例如在天文观测等领域由于观测能力的上下限导致数据未被观测记录,在生存分析等领域由于观测时间有限导致的时序数列首尾截断等。多种双侧截断形式导致基于该类样本数据无法获得准确的数据特征和精准的参数估计结果。故而本文分别从特定模型下双侧截断数据的参数估计和基于深度学习的数据特征学习方法出发,研究双侧截断数据下的参数估计和数据预测问题。本文首先将双侧截断数据背景下的参数估计在已有研究基础上扩展至部分线性模型的线性部分参数估计与非线性部分拟合。基于逆概率加权的核估计可以给出模型线性部分的参数估计,并给出了估计量的偏差与方差的渐近表达式。在数值模拟部分,选取不同类型的非线性函数,不同维数的协变量以及符合不同分布的截断变量,与传统的部分线性模型参数估计方法进行对比,得出本章提出的方法可以给出更加精确的参数估计结果,且在非线性部分拟合上十分接近未被截断的完整样本拟合结果。并通过AIDS病毒感染数据实例验证了该方法的实用性。考虑到双侧截断数据在诸多领域中存在,为摆脱具体模型框架的限制,进一步扩展其运用的广泛性,考虑从深度学习的思想出发,为该种特殊的缺失模式寻找良好的数据学习重构与预测算法。本文利用基于长短期记忆神经网络的变分自编码器(VAE_LSTM),实现了对双侧截断数据的学习与重构。并借助某城市街道的污染监测数据集,与传统的LSTM和基于LSTM的自编码器算法对比,验证了该算法的数据重构与预测能力。
其他文献
非侵入式负荷分解作为电力需求侧管理中的重要组成部分,可以通过智能电表获取总能耗,分析获得其下单个用电设备的能耗数据,从而为需求侧反馈提供技术支撑。该方法旨在监测建筑内各个用电设备的功耗情况,使用户在知晓能源消耗水平的情况下,主动节约能源,提高能源利用率。同时,电力公司通过了解用户负荷构成和消费习惯,制定不同的动态定价策略,引导用户合理消费,有效增强电网运行效率。近年来,基于深度学习模型的负荷分解方
学位
随着时代的高速发展,人与人之间沟通交流的方式也由原始的口口相传、书信通讯变成了利用互联网技术进行的多媒体数据的传播。而在多媒体数据中,数字图像因其简洁直观、信息传达效率高的特点,被人们作为通信载体广泛应用于信息交流中。然而互联网的普及是一把“双刃剑”,随着应用的不断增多和互联网模式对现实场景的不断下沉,图像信息安全问题日益凸显,与之相关的信息安全课题也不断受到研究人员的关注。不同于图像加密技术破坏
学位
目的 :比较机械通气下采用CT与电阻抗断层成像(electrical impedance imaging,EIT)滴定最佳呼气末正压(positive end-expiratory pressure,PEEP)的差异,以证实采用EIT滴定PEEP的可行性。方法:先对7只小猪建立急性呼吸窘迫综合征(acute respiratory distress syndrome,ARDS)模型,然后在不同PE
期刊
统计过程控制和设备维修决策是保证生产系统稳定和提升产品质量的两大方法。前者通过监控产品的核心质量指标,防止产品偏离所期望的质量,以保证生产过程的稳定性;后者根据设备的运行情况以及故障的历史数据,制定最佳的维修方案,防止设备故障导致生产停滞,以保证生产过程的可靠性。对于多质量特性产品的生产过程,动态控制图能够及时监测到微小的质量偏移,及时发现过程异常。另外,将动态控制图与视情维修策略相结合,构建动态
学位
机器学习近年来应用到气象、医学、环境和材料等领域。在环境材料领域中,具有高比表面积和多孔结构的吸附剂可以去除水体或土壤中的有机污染物以及重金属离子,吸引了众多学者的关注。然而,获得吸附容量和规律的批量实验复杂且耗时,并且目前的研究注重于吸附剂的物化性质,忽略了吸附质和环境因素的影响。机器学习不仅可以对自变量和因变量之间复杂的非线性关系进行建模和预测,还可以从实验数据中探究其隐藏的自然规律。因此通过
学位
随着互联网技术的快速发展,在网络中进行资料生产和信息交流越来越便捷,但同时抄袭剽窃等不良现象也屡屡发生并有愈演愈烈之势,特别是在学术生产活动中此类现象更是被频繁曝光。遏制抄袭剽窃活动的发生与检测识别这些抄袭剽窃活动成为学者研究的热点之一。文本抄袭检测是一门针对文章内是否含有抄袭内容的研究课题,主要分为外部与内部抄袭检测两个框架。虽然目前的方法在复制粘贴和同义替换类型的抄袭形式上具有优异的性能,但仍
学位
近年来,行人检测是目标检测热门研究领域之一,主要是利用计算机视觉技术检测图像或者视频序列中是否有行人存在,并且标出每个行人的确定位置。行人检测在智能安全监控、自动驾驶、人机交互等方面有着重要的研究价值和广泛的应用前景。现有行人检测方法大多采用特征金字塔进行多级预测,虽然能检测多尺度的目标,但易产生离物体中心较远的预测框,导致检测精度不高。在行人密集、遮挡严重的情况下,相关网络模型无法获取足够的目标
学位
随着国内消费市场迎来新一轮消费升级,许多品牌通过品牌升级来谋求新的发展出路。面对新消费群体和新老烘焙品牌的挑战,成立30年的好利来用新模式实现了品牌年轻化,带动了国内烘焙行业发展,提高了发展水平,是本土品牌学习的对象和创新发展的风向标。本文从品牌为什么要年轻化、如何年轻化以及年轻化后的困境,以好利来为例进行分析,旨在为其他国货品牌创新升级提供思路,促进国货品牌长远发展。
期刊
随着车险费率市场化改革的进行,我国逐步将车险的定价权交由保险公司行使,因此识别客户风险、厘定差异化的车险保费也成为保险公司的研究重点。然而,目前我国使用的车险费率因子较为单一,费率厘定模式缺乏客观性,而且用于费率厘定的模型也较为传统和落后。为此,本文将更多的车险费率因子引入模型中,并改进现有模型对纯保费和自主定价系数进行研究,为保险公司创新车险产品提供参考。首先,本文在参考美国车险费率厘定模式的基
学位
随着通讯技术与互联网技术的快速发展,形式多样的数据已渗入到人们日常生活中的方方面面,越来越多的用户选择将数据外包存储至云服务器中,如何确保外包数据的完整性成为了云存储中亟需解决的关键问题。云数据审计方案能够通过辅助信息对数据进行验证以判断数据的完整性是否被破坏,为用户外包于云服务器中的数据安全性提供了一定的保障。然而,传统的云数据审计方案着重于判断外包数据的完整性,而忽略了数据动态操作的性能需求和
学位