基于周期信息的时间序列缺失值填补方法研究

来源 :中山大学 | 被引量 : 0次 | 上传用户:shadao
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
研究背景: 时间序列模型已经是医学研究领域中重要的分析手段之一。然而,医学时间序列数据收集时常面临各种问题,缺失数据以及不规则采样的情况在实际的资料收集中时有发生,而这些情况有时是无法通过质量控制杜绝的。如何应用数学方法和模型通过填补数据来解决不规则采样以及含缺失数据的时间序列是研究的热点问题之一。 缺失值的填补方法众多,概括有:删除法(Deletion)、加权调整法(Weighting)、填补法。删除法与加权调整法都比较简单易行,但是代价是这两种方法给出的填补值信息量较少,偏离真值。填补法是对各种填补措施的概括,常见的填补方法有替代法和建模估计法。回归填补法、热平台填补法和冷平台填补法以及多重填充法。研究的比较多的多重填充法有以下几种:PMM法(Predictive Mean Matching,PMM)、趋势得分法(Propensity Score,PS)、马尔科夫链蒙特卡罗法(Markov Chain Monte Carlo,MCMC)。目前应用于时间序列的新插值方法主要有:抛物线法、牛顿法、分段法等。 这些方法直接应用于时间序列数据时存在以下的问题:①多数缺失值填补方法并不是针对时间序列数据设计的,很多方法在应用于时间序列数据研究时受到限制,难以进行。②缺失值的填补方法一般通过简单的替代和删除获得新的样本,但是由于时间的不可逆性导致每个时间点的测量值的不可重现性,致使这种思路在时间序列中是行不通的。③各种缺失值的填补方法对连续型缺失的耐受性比较差;随机型缺失在达到30%以上时一般的填补方法效果不佳。 本研究提出的基于周期信息的时间序列填补方法具有以下优势:①充分利用了时间序列数据的周期性特点,基于周期信息通过谱峰值加权填补时间序列缺失值,具有时间序列的个性化特点。并融合了时域技术和频域技术,能够较全面地反映时间序列的缺失值信息。②避免了简单处理时间序列缺失值造成的信息损失和浪费,以及生搬硬套式的填补造成原序列数据信息的丢失和扭曲。③该方法对于随机型缺失以及连续型缺失数据的填补均有较稳健的填补效果。 研究目的:: (1)探讨适用于周期性时间序列缺失数据(连续型、完全随机型缺失)的处理流程理论和算法,应用计算机模拟数据探寻填补方法的适用性,形成含周期性时间序列的缺失数据填补流程,以及该方法对不同程度不同类型缺失的耐受性。 (2)对相应的填补方法进行误差估计,用不同的误差评价指标量化填补方法的误差,从不同的角度考察方法的填补效果。 (3)用两种不同缺失类型(连续型、完全随机型缺失)的实例序列进一步研究,探讨模型的实用性以及模型的应用范围。 研究方法: 本研究属统计学方法的应用基础研究。基于时间序列模型的时域理论及频域理论,应用频域信息来指导缺失数值的估算;设计相应的缺失数据的填补流程,并考察缺失数据填补方法的应用效果。通过实际数据和模拟数据的应用评价周期性时间序列缺失值填补方法的填补效果,探讨该流程相应的适用条件。研究方法涉及时域信息提取、频域信息提取、计算机模拟试验、综合多个周期的加权法、实例数据的应用、填补效果考核等,较客观地展现填补方法的填补效果。 结果: 通过模拟,产生时间序列数据资料的两种缺失类型,完全随机缺失和连续型缺失,应用周期性填补方法填补并与spline(本次研究所选的填补缺失值的对照方法,是一种基于三次样条函数对数据进行平滑填补的方法,文中简称为spline)插值填补结果进行比较研究。得到以下结果:①利用SAS模拟数据研究,周期性填补方法对于完全随机型缺失和连续型缺失填补值的标准化的均方根误差(NRMSE)与均方根误差(RMSE)均较小,两种类型的缺失值填补效果都相对较稳定。②随机型缺失时,随着缺失比例的增加周期性填补与spline填补两者的填补效果均有下降,但周期性填补的效果始终优于spline填补的效果。③不同长度的序列对缺失值填补有影响。相同的缺失比例,随着序列长度的增加,周期性填补和spline填补的NRMSE与RMSE值均增大,填补的效果均降低。④连续型缺失随着缺失个数的增多,连续型缺失比较严重时,周期性填补较spline填补法稳定,填补的效果也优。 实例数据研究的结果也显示:①随机型缺失时,周期性填补和spline填补效果相当,NRMSE和RMSE值均较小,近似于0,填补值比较准确。②连续型缺失时,周期型填补较spline填补准确,填补效果好。 结论: 根据缺失值的填补结果可得,周期性填补方法对于缺失类型为随机型缺失和连续型缺失均体现较好的效果。与spline填补相比,周期性填补的稳定性也是较好的。而对于缺失比例相同,序列长度不同的数据,周期性填补效果会随着时间序列的长度增加而改善。对于连续性缺失周期性填补的效果凸显自身的优势。随着连续型缺失个数的增加,周期性填补的效果稳定而准确,不会随着连续缺失个数的增加而有较大的波动。
其他文献
摘要案例教学是一种有效的教学方式,已在各类课程的教学中得到了广泛的应用。逻辑学要提高教学效果,有必要引入案例教学。逻辑学与案例教学有共同的渊源,说明逻辑学引入案例教学具有可行性。但逻辑学具有自身的学科特性,所以,逻辑学案例教学应依据其学科特性进行。逻辑学案例教学要取得实效,需要处理好案例教学与举例教学、课程体系、课堂讲授等方面的关系。  关键词案例教学 逻辑学 方法  中图分类号:G420文献标识
请下载后查看,本文暂不支持在线获取查看简介。 Please download to view, this article does not support online access to view profile.
期刊
摘要本文旨在研究建构“以学生为主体,以教师为主导,以创新为主线,以运用为目标”的“导、读、用”英语教学模式,实现教学过程的优化,充分体现英语教学“多层次、快节奏、多信息、高密度、重操练”等特征,调动学生学习英语的积极性和主动性,提高英语课堂教学效率和教学质量。  关键词“导、读、用” 教学效率  中图分类号:G633.4文献标识码:A    高中英语教学侧重于培养学生“听、说、读、写”能力的培养,
摘要近几年来,中职制冷和空调设备运用与维修专业由于受到招生、办学、就业等多种因素的影响,部分学校对此专业采取了停办、合并等措施,我校自2005年开始对此专业进行改革,通过五年的努力,该专业走上了良好的发展道路,本文结合我校在制冷和空调设备运用与维修专业的改革实践,共同探讨该专业的改革思路。  关键词探索 中职 制冷和空调专业 改革  中图分类号:G420文献标识码:A    “以就业为导向,以能力
体验教育是通过实践活动使学生得到真实的情感经验,从而不断提高认识世界、明辨是非的能力,借此不断促进学生成长的教育方式。大量事实也表明:一个人理想、信念的确立,思想品德的形成,行为习惯的养成必须在生活之中形成,也就是说必须在生活实践中完成。因此,教育者必须转变思想观念和方式,努力发挥学生的自主性、主动性、创造性,促进其积极参与到实践活动中去。只有学生自觉自愿地参与到各种活动中,才能形成品德发展的内动
摘 要:本文结合教学实践,从理论上详尽阐述笔者在课堂上利用学案导学法的教学方法,充分挖掘学生的创造力和潜能,让学生进入自主学习环节,有效实现以教师的“少教”达到学生的“多学”的教学效果。  关键词:少教多学 学案导学 语文教学  当今社会,我们所处的时代是一个多元而和谐的时代,我们在思维方式上也应该进行转变,包括我们的教育思想。我们的语文课堂不能还停留在传统的“满堂灌”教学模式上,要将我们的
女儿给了我一个机会,让我第一次也是唯一一次,完整地目睹了一个孩子的成长过程;是她让我体会到了生活并非是享受;也是她让我体验到教育的复杂和快乐。给女儿洗头心理巧“按摩
摘要中小学数学教学衔接是许多中学数学教师,尤其是初一数学教师感到困惑而又急需关注的问题,九年义务教育分成小学和初中两个阶段,而中小学教师之间的联系甚少,出现了一些教学脱节现象。本文结合笔者的教学经验,着重阐述中小学数学教学要注意五方面的衔接,以提高中小学数学教学效率。  关键词教学衔接 教学内容 学生情感心理  中图分类号:G633.6文献标识码:A    中小学数学教学衔接问题是数学教学改革中常
摘要英语教学的目的是培养学生用英语进行交际的能力,是教师在教学中始终要关注的问题。教师要重视课堂内外指导学生英语交际的能力。要学生了解语言所承载的深刻文化内涵,以培养学生的跨文化交际意识,从而提高他们使用恰当的语言进行交际的能力。  关键词英语教学 交际 跨文化   中图分类号:G633.4文献标识码:A    从事高中英语教学十余年来,笔者一直注重培养学生用英语进行交际的能力。全日制义务教育普通
中学《语文》教材中收录了许多优美的古代诗歌,新《课程标准》也对诗歌教学提出了要求,即“阅读诗歌,大体把握诗意,想象诗歌描述的情境,体会诗人的情感”。由此可见,诗歌教学不仅仅是让学生理解诗意,还要让学生在理解大意的基础上,把握 “只可意会不可言传”的意境。要在读中去想象多彩的画面、把握诗人丰富的情感、理解诗句深邃的哲理。下面就结合自己的教学实例谈谈对诗歌教学的点滴体会。  一、学生对话诗人,把握深刻